最近のAIやプログラミング言語関連技術の進歩について調べてみた①

以下、APIか、今あるいは今後使えそうなAI関連技術を中心に調べ、メモしました。

・テキストベースのチャットボット

 ・ChatGPT

 ・Copilot(旧Bing Chat)

 ・Gemini(旧Bard) ただし、テキストだけでなく画像・動画が扱えるマルチモーダルな生成AIである。

音声認識AI

 ・Whisper

・画像認識AI

    ・GPT-4V

・画像生成AI

 ・DALL-E3

 ・Stable Diffusion

 ※他にも覚えきれないくらいあり、名前も覚えにくい。

 https://mo-la.jp/digital/84329/

・動画生成AI

 ・Sora

 ・Lumiere

 他にもあります。

 https://mo-la.jp/digital/85157/

 

全然違う機能なのに名前が他社で似てることもあり、注意が必要です。

例えば、コーディングをサポートしてくれるGithub Copilotは、MicrosoftのCopilotと似てますし、Open AIのWhisperはAWSのCodeWispererに似てます。

 

プログラミング言語では、環境設定が難しいことが多いですが、ブラウザ上で、PythonC言語がコーディングできるGoogle colabolatoryというのがあるようです。GPUで動作できるみたい。