GoogleがAIモデルの最新版
「Gemini(ジェミニ)」を発表しました。
今年は
OpenAIがChatGPTを発表したのをきっかけに
AIが非常に盛り上がった1年。
このAI元年とも言える2023年の締めくくりに
Googleが動きました。
Gemini (ジェミニ)
「 Gemini 」はGoogleの最新の大型言語モデル(LLM)で
今までよりも更に
テキストの生成、翻訳、要約、質問への回答などの
さまざまなタスクに使うことができ
精度も向上していると言われています。
その中でも
テキスト・画像・音声・動画など
複数の種類のデータを一度に処理できる
マルチモーダル処理性能が
大幅に向上しており
今後様々な分野で使用される可能性が盛りだくさんだと言われています。
ChatGPT越え?いや人越えです。
GoogleのAIモデルは
LaMDA → PaLM → PaLM 2と
進化してきて
今回の「 Gemini 」になります。
Geminiには3つのバージョンがあり
最高性能の「Ultra」
バランスの良い「Pro」
最軽量の「Nano」です。
AIの知識量・言語理解能力・マルチタスク性能を
計測するための「MMLU」という試験がありまして
これを人間の専門家が受けた時の
スコアが89.8%だったのですが
Geminiはそれを少し超える
90.0%を叩き出したんです。
ちなみにGPT-4は86.4%だそうです。
ただ人とGPT-4を追い越したのはUltraで
クラウドスーパーコンピューターでしか
動かせないほど
重くまだ実用的ではなさそうです。
一方スマホ上で動かせるくらい軽いバージョンの「Nano」もあり
GoogleのスマホPixel 8にも搭載されているとされています。
今は、スマホで録音すると文字起こしをしてくれて要約まで
作ってくれるんですよ。
WhatsAppアプリなんかではGoogleキーボードを使っていれば
スマート返信機能も使えるようになります。
知ってました?
今後、より多くのメッセージ系アプリでも
来年にはOS全体へ拡大対応を予定されているとも言われています。
Bardがしゃべる
来年中に、Google AssistantにBardを追加予定。
Bardで変化するポイントの詳細は明かされていないものの
プレス向けイベントのでも動画では、Bardがユーザーに語りかけるシーンがありました。
Siri、Alexa、Google Assistantなどのスマートアシスタントは、現状、事前準備された制限つき回答しかできませんが
ここにAIエンジンが乗ることによってより自然で正確な指示や会話ができるものだと考えられています。
全てのGoogleサービスで活用
プログラミングも得意
Googleのコーディングロボ「AlphaCode」においても
Gemini登場で、新たなコーディングAIとして「AlphaCode 2」が発表。
コーディングだけでなく、複雑な数学や理論的コンピュータ科学の問題も含め
プログラミング課題を解いていく能力に長けているそうです。
Geminiの技術は、BardやPixel、コーディングツールだけではなく
Google Chromeや検索、広告など
ありとあらゆる Googleのサービスに拡大されていく予定です。