テクノロジーは誕生以来、一般的に専門化の方向に発展してきました。初期の汎用ツールは特定のタスクに合わせたニッチな道具に進化し、最終的には農業、戦争、製造などに特化した機械の登場につながりました。ここ数十年、こうした専門化は、事前定義された狭い目的のために設計されたコンピュータアルゴリズムの形を取ってきました。ソフトウェアにおいては、このアプローチは各課題に合わせてカスタマイズされたソリューションを構築することを意味します。これは人工知能 (AI) の領域で広く採用されている考え方です。
従来型の AI では、モデルはテキストの翻訳、顔の認識、傾向の予測など、単一の分野で優れた能力を発揮するよう綿密に作成されています。これは最近まで、専門化が AI の複雑さに対する唯一の信頼できるアプローチと見なされていたためです。
残念ながら、現代の組織は多様なデータタイプの急増、予測不可能な需要、大規模な適応能力の必要性に直面しており、AI の専門化の限界が明らかになりつつあります。これらの懸念に対処するために、AI に対する新しいアプローチが現われました。それが生成 AI (GenAI) の基盤モデルです。
生成 AI の基盤モデルにより、組織は適応性の高い単一のフレームワークを使用して幅広いタスクに対処できるようになります。これらのモデルは、非常に膨大なデータセットと高度なトレーニング手法を活用して、さまざまなアプリケーションにわたって一般化を行うよう構築されています。基盤モデルを特徴付け、従来の AI システムと差別化する主な特性には、次のようなものがあります。
- スケーラブルな設計
基盤モデルは、高スループット GPU などのハードウェアの進歩、効率的なトランスフォーマーアーキテクチャ、豊富な非構造化データを活用して、その開発とパフォーマンスを支えています。
- 従来型のトレーニング方法
教師なし学習、教師あり学習、人間のフィードバックによる強化学習 (RLHF) などの手法を組み合わせることで、出力を改善できます。
- 転移可能な学習機能
これらのモデルは、一般化されたデータに基づく事前トレーニングで得られた知識を特定のタスクに合わせて微調整することで多様なアプリケーションを効率的に処理できます。
- 創発的行動
基盤モデルは、明示的にプログラムされるのではなく、トレーニングデータから導き出された複雑な動作を行い、驚くほど精緻な出力を可能にします。
- 均質化されたアプリケーション
単一の基盤モデルが複数のアプリケーションの基盤として機能し、汎用的な学習アプローチによって開発を簡素化できます。
- 汎用性の高い機能
基盤モデルは、同一フレームワーク内でテキスト、画像、コードなどの複数のデータタイプを処理する構造になっており、ユースケースを大幅に拡大します。
各基盤モデルは、機能、アプリケーション、出力に大きな違いがあります。自然言語処理などのタスク向けに設計されたものもあれば、画像の生成やソフトウェア開発のサポートを主眼としたものもあります。以下に紹介するのは最も注目すべき基盤モデルとプラットフォームで、それぞれに独自の機能と強みがあります。
- GPT
OpenAI 社が開発した Generative Pre-trained Transformer (GPT) シリーズは、最もよく知られた基盤モデルの 1 つです。これらのモデルには GPT-3 や GPT-4 のようなバージョンによって ChatGPT などのツールを駆動し、テキスト生成、要約、質問回答に高度な能力を発揮します。
- Stable Diffusion
この Text-to-Image モデルは、ノイズ追加とノイズ除去の技術を使用して高品質の画像を生成します。効率性で知られており、競合他社に比べて必要な計算リソースは最小限で、スマートフォンなどのデバイスで実行できます。
- BERT
BERT は、Bidirectional Encoder Representations from Transformers の略で、基盤モデルの初期のマイルストーンでした。2018 年にリリースされ、テキスト内のコンテキストを理解することに優れており、質問への回答やテキスト分類などのタスクに使用されています。
- Claude
Anthropic 社の Claude モデル (Claude 3.5 Sonnet、Opus、Haiku を含む) は、包括的な自然言語機能を提供します。ワークフローの自動化、コンテンツのモデレーション、研究の加速などのタスク向けに設計されており、分かりやすく迅速な応答に重点を置いています。
- AI21 Jurassic シリーズ
AI21 Labs 社の Jurassic-1 と Jurassic-2 は、人間が書いたようなテキストの生成と複雑な言語タスクの解決に特化しています。Jurassic シリーズは GPT と同等の機能を持ち、高度な指示追従能力で知られています。
- Amazon Titan
Amazon 社の Titan モデルは、テキストの生成や要約から埋め込みによるセマンティック検索まで、さまざまなタスクをサポートします。これらのモデルは、特定のユースケースに合わせて微調整でき、高い柔軟性を備えています。
- Cohere
Cohere は生成モデルと表現モデルの両方を提供します。一部の競合他社のものよりサイズは小さいですが、言語理解と意味解析に優れています。
- BLOOM
BLOOM は研究者たちが共同開発した多言語モデルで、46 の言語によるテキストと、13 のプログラミング言語よるコードを生成できます。その効率性とオープンアクセス設計により、コラボレーション型 AI 開発において際立つ存在になっています。
生成 AI の基盤モデルの主な価値は、その汎用性にあります。これらのモデルは、さまざまな業界の幅広いタスクに対応できます。例として以下のようなタスクがありますが、これらに限定されません。
言語処理
基盤モデルは自然言語処理 (NLP) に優れており、言語翻訳、感情分析、自動コンテンツ作成などの機能を実現します。一貫性のあるテキストを生成したり、ドキュメントを要約したり、複雑な質問に対応したりできるので、顧客とのコミュニケーションやナレッジ管理などのタスクに非常に有益です。
視覚的理解
基盤モデルは、視覚データを分析したり生成したりできます (これはコンピュータービジョンの主要な要素です)。物体の特定、パターンの検出、テキストプロンプトからの画像作成が可能です。これらの機能は、自律走行車両、医療用画像、コンテンツモデレーションなどに適用できます。
コード生成
これらのモデルは、ノーコード開発とローコード開発の概念を論理的に帰結させ、自然言語のプロンプトを関数型プログラミング言語に変換し、ソフトウェアアプリケーションの構築に必要な時間と労力を削減します。コード作成だけでなく、既存のプログラムのデバッグと最適化も可能で、自動化とイノベーションのための強力なツールを開発者に提供します。
人間中心のエンゲージメント
基盤モデルは、臨床診断からカスタマーサービスやカスタマーサポート向けの AI チャットボットまで、あらゆる分野で人間の意思決定とやりとりを強化する上で非常に効果的です。これらのモデルは、人間による入力から学習することで予測と応答を継続的に改善できます。
音声からテキストへの変換
基盤モデルは高度な言語理解機能を使用して、ビデオのキャプション付け、会話の文字起こし、リアルタイムの言語解釈などのアプリケーションで音声をテキストに書き起こすことができます。
簡単に言えば、基盤モデルは組織での人工知能の活用方法を変革しています。強力な事前トレーニング済みモデルとして機能することで、特化型の AI システムを構築する必要がなくなります。同時に、その汎用性により、ビジネスにおいてより幅広いタスクや業界にわたって AI を適用できるようになります。これにより、次のような大きなメリットが得られます。
効率性と生産性の向上
基盤モデルは、反復的で時間のかかるタスクを自動化することで、オペレーションを最適化します。たとえば、データの分類、顧客からの問い合わせのルーティング、レポートの生成を人間の介入を最小限に抑えつつ実行できます。これらの機能により、組織では手作業を削減しながらオペレーションを拡張できます。開発者は生成ツールを使用してコードの作成とデバッグを迅速化でき、経営幹部には、AI が生成した長文ドキュメントの要約によって意思決定プロセスを迅速化できるというベネフィットがあります。
コンテンツ作成の迅速化
マーケティングチームとコンテンツチームは、基盤モデルの迅速なコンテンツ生成機能から大きなベネフィットを得られます。さまざまなトピックに関する高品質のテキストを作成したり、資料を複数の言語に翻訳したり、キャンペーンをサポートする画像やビデオを作成したりすることさえできます。この迅速化によって、変化する市場の需要により素早く対応できるようになります。
コスト効率の高いイノベーション
事前にトレーニングされた基盤モデルを使用することで、AI システムをゼロからトレーニングすることに伴うコストを大幅に節約できます。これらのモデルは強力な出発点となり、最小限の微調整だけで特定のタスクや業界に適合させることができます。このアプローチにより、AI がより広く利用可能になり、開発に必要な計算リソースと専門知識を削減できます。
データ分析と意思決定の強化
基盤モデルは、構造化されていない情報を含む大規模なデータセットの処理と分析に優れています。ビジネスリーダーは、市場分析、感情追跡、フィードバックの解釈などのタスクにこれらの機能を活用できます。これらのモデルは、従来の手法に比べて精度が高く実用的なインサイトをより迅速に提供することで、戦略的意思決定プロセスを強化します。
カスタマーエンゲージメントの向上
基盤モデルを活用した生成 AI ツールは、パーソナライズされた効率的なやりとりを実現することで、顧客コミュニケーションを強化します。これには、顧客からの問い合わせの管理や、カスタマイズされた回答の作成の支援なども含まれます。これにより、サービスチームの作業負荷を軽減しながら、顧客満足度を向上させる機会が得られます。
イノベーションと創造性の最適化
基盤モデルの創造的な可能性は、見落とされがちですが、ビジネスの観点からは価値があります。AI が生成する革新的なアート、デザイン、多面的なメディアコンテンツの開発が可能になります。基盤モデルは AI ができることの限界を拡大し、エンターテインメント、マーケティング、製品設計をはじめ、創造性への斬新なアプローチから恩恵を受けるあらゆる業界で、新たな機会を開拓しています。
基盤モデルは柔軟な機能と幅広いユースケースを提供しますが、このテクノロジーに課題がないわけではありません。そうした課題は、生成 AI を基盤としたソリューションを導入する際に、組織が対処する必要がある重要な問題を提起する場合があります。考慮すべき重要な課題には次のようなものがあります。
セキュリティ
一元的なシステムとしての基盤モデルには、デジタルセキュリティ関連のリスクがいくつかあります。単一障害点となり、攻撃者にとっては魅力的なターゲットと見なされます。侵害が成功すると、機密データが漏洩したり、オペレーションが中断されたり、さらにはモデル自体の動作が変更されて有害な結果が生み出されたりする可能性があります。これらの脆弱性は、機密情報を日常的に処理する業界で特に懸念となります。
これらのリスクに対処するには、暗号化プロトコル、定期的な脆弱性アセスメント、アクセスコントロールなど、包括的なサイバーセキュリティ対策に投資する必要があります。分散型アプローチを開発し、重要なシステムを複数のノードに分散させることで、単一障害点の危険性を軽減することもできます。さらに、AI プロバイダーが安全なモデルアーキテクチャを採用し、システム監査の一貫したスケジュールを設定することでもセキュリティを強化できます。
バイアス
基盤モデルは大規模なデータセットでトレーニングされるため、トレーニングデータに存在するバイアスを反映してしまうこともよくあります。ジェンダーに関する固定観念から文化的偏見まで、この課題は、採用プラットフォームや信用評価などの意思決定システムでバイアスを含むモデルが使用されている場合に特に問題になります。
開発者は、トレーニングプロセスでは多様で包摂的なデータセットを優先して、固有のバイアスを最小限に抑える必要があります。モデルの出力の定期的な監査と外部レビューを実施することで説明責任を確立でき、トレーニング中に公平性に重点を置いたアルゴリズムを組み込むことで結果の公平性を高められます。
倫理的懸念
基盤モデルは、特に個人の生活に大きな影響を与える可能性のあるアプリケーションで使用される場合、倫理的な問題を提起します。医療診断や法的意思決定などの分野では、これらのモデルが意図せず基本的権利を侵害する判断を出力する可能性があります。特にその「ブラックボックス」的な性質を考えると、説明責任の欠如によって問題が生じる可能性もあります。
倫理的な懸念に対処するために、組織は AI の責任ある使用に関する明確なガイドラインを確立する必要があります。倫理的審査委員会を設置し、分野横断的なコラボレーションを行うことで、これらのモデルを展開する前にその潜在的な影響を評価できるようになります。透明性も同様に非常に重要です。AI プロバイダーは、モデルのトレーニングデータ、制限事項、意図された用途を明確に文書化し、ステークホルダーがその使用について情報に基づいた意思決定を行えるようにする必要があります。
環境への懸念
基盤モデルのトレーニングと運用には膨大な計算リソースが必要であり、それが大きな環境負荷の原因になります。トレーニング中の大きなエネルギー消費量が二酸化炭素排出量の増大につながることから、この技術の持続可能性について懸念が生じています。
組織は、モデルアーキテクチャを最適化して必要な計算能力を減らすことで、環境への影響を軽減できます。エネルギー効率に優れたハードウェアを活用し、データセンターで再生可能なエネルギー源を優先することも、二酸化炭素排出量の削減につながります。共同の取り組みを通じて小型でありながら同等の効果を持つモデルを開発することで、パフォーマンスを犠牲にすることなく、環境負荷をさらに減らせる可能性があります。
基盤モデル固有の適応性と拡張性の高さを考えると、その用途はほぼ無限に考えられます。とは言え、一部の業界は、抱える課題の性質と生成するデータを理由として、このテクノロジーから特に大きな恩恵を受けられる状況にあります。それらの主要な分野と、そこでどのように基盤モデルを活用できるかを次に紹介します。
- ヘルスケア
基盤モデルは、創薬に役立ち (治療に利用できる可能性のある化合物の生成など)、革新的な医薬品の設計を支援します。また、画像診断やパーソナライズされた患者ケアなどのタスクもサポートします。
- 法務
法務専門家は、ドキュメントのドラフト作成、契約分析、判例法の要約などのタスクに基盤モデルを使用できるでしょう。事実の正確性とトレーサビリティの向上により、その有用性はさらに拡大する可能性があります。
- 教育
これらのモデルは、練習問題を生成したり、授業計画を作成したり、個人の学習スタイルに基づいて学生に合わせたフィードバックを提供したりすることで、パーソナライズされた学習を支援することができるでしょう。
- 金融
基盤モデルは、不正行為の検出を強化したり、市場の傾向を分析したり、予測型インサイトを生成して意思決定をサポートしたりすることで、財務リスク管理や顧客エンゲージメントに計り知れない価値を提供します。
- 製造業
これらのモデルは、サプライチェーンの最適化、機器の故障の予測、AI が生成したプロトタイプの活用による新製品の設計などを行うことが可能です。
- 小売
小売業においては、基盤モデルが AI 主導型のチャットボットと推奨システムを通じて、マーケティングのパーソナライズ化や顧客とのやり取りの強化をサポートします。
生成 AI の基盤モデルは、高度なニューラルネットワークアーキテクチャとトレーニング手法に依存してデータの処理と出力の生成をします。その工程には、大規模なデータセット内のパターン、関係、コンテキストを理解することが含まれ、それによってテキストの生成から画像の作成までに至るさまざまなタスクを実行できます。これらのモデルを駆動する主なプロセスの内訳は以下の通りです。
トランスフォーマーアーキテクチャ
基盤モデルの中核となるのはトランスフォーマーアーキテクチャで、これは 2017 年に Google 社の研究者によって生み出されました。従来の再帰型ニューラルネットワークや畳み込みニューラルネットワークとは異なり、トランスフォーマーは「注意機構」を使用して連続データにおけるさまざまな要素の重要性を重み付けするよう設計されています。これにより、複雑な入力 (テキストや画像など) を処理し、シーケンス内の次のアイテムを正確に予測することが可能になります。
自己教師あり学習
基盤モデルは自己教師あり学習を使用し、ラベルが付いていない大量のデータでトレーニングします。これらのモデルは入力データからラベルを自律的に作成することで、手動でラベル付けされたデータセットの必要性を排除し、トレーニングプロセスの拡張性と効率性を高めます。このアプローチは、従来の機械学習 (ML) 手法との重要な差別化要因です。
事前学習
基盤モデルは、多くの場合インターネットから収集された膨大なデータセットに事前学習中にさらされることで、言語やその他のデータタイプの統計的パターンを学習します。このステージは計算負荷が高く、一般的な理解に重点を置き、タスク固有の専門知識ではなく幅広い機能をモデルに装備します。
調整
事前学習の後、より小さなドメイン固有のデータセットを使用してモデルを微調整します。このフェーズでは、適合性と正確性に焦点を当て、出力を改善することで、専門的なタスクにモデルを適応させます。多くの場合、微調整には人間によるフィードバックを組み込み、モデルの動作と期待される成果の整合性を高めます。
基盤モデルは生成 AI の心臓部です。さまざまなタスクに適応して実行する能力があることで、AI テクノロジーの進化に応じて適合性を維持し続けることができます。汎用人工知能 (AGI) という最終的な目標は依然として遠くにありますが、基盤モデルの開発は、より高度で適応性の高い AI システムに向けた重要なステップです。
基盤モデルがより強力になるにつれて、組織、規制当局、社会が、その進歩に伴う課題への対処に取り組むことが不可欠です。基盤モデルの責任ある開発と展開を確実に行うことで、リスクを最小限に抑えながらベネフィットを最大化できます。急速に進化するこの分野の発展について、専門家やステークホルダーに常に情報を提供しつづけるには、継続的な教育とリソースが不可欠です。
ServiceNow は、今日における主要なエンタープライズ AI ソリューションであり、基盤モデルの可能性を最大限に活用するために必要なツールを組織に提供します。それをすべて Now Platform® の AI 機能を通じて実現しています。
Now Platform は、IT、カスタマーサービス、HR などさまざまな分野で AI をワークフローにシームレスに統合することを目指して構築されています。また、自然言語理解、インテリジェントな自動化、高度なデータ分析などのネイティブ AI 機能により、この包括的なソリューションは組織がビジネス全体の運用を簡素化し、生産性を向上させ、卓越したユーザーエクスペリエンスを提供できるよう支援します。ServiceNow の生成 AI コントローラーは、これらの機能をさらに強化し、複雑なカスタムスクリプティングなしに、組織が OpenAI、Azure OpenAI、ServiceNow 独自の Now LLM などの大規模言語モデルに接続し、構成して、管理できるようにします。
反復的なタスクの自動化から、実用的なインサイトの生成、セルフサービスの改善に至るまで、ServiceNow はあらゆる業界の組織が新たなレベルのイノベーションを実現できるよう支援します。今すぐ ServiceNow のデモをご覧になり、AI の活用方法をご確認ください。