以下、APIか、今あるいは今後使えそうなAI関連技術を中心に調べ、メモしました。
・テキストベースのチャットボット
・ChatGPT
・Copilot(旧Bing Chat)
・Gemini(旧Bard) ただし、テキストだけでなく画像・動画が扱えるマルチモーダルな生成AIである。
・音声認識AI
・Whisper
・画像認識AI
・GPT-4V
・画像生成AI
・DALL-E3
・Stable Diffusion
※他にも覚えきれないくらいあり、名前も覚えにくい。
https://mo-la.jp/digital/84329/
・動画生成AI
・Sora
・Lumiere
他にもあります。
https://mo-la.jp/digital/85157/
全然違う機能なのに名前が他社で似てることもあり、注意が必要です。
例えば、コーディングをサポートしてくれるGithub Copilotは、MicrosoftのCopilotと似てますし、Open AIのWhisperはAWSのCodeWispererに似てます。
プログラミング言語では、環境設定が難しいことが多いですが、ブラウザ上で、PythonやC言語がコーディングできるGoogle colabolatoryというのがあるようです。GPUで動作できるみたい。