拡大する人工知能分野には多数のメリットがありますが、その 1 つは膨大で複雑なデータを理解できることです。実世界の情報を処理する際の基本的な課題は、類似性を判断することです。コンピューターは正確な数値計算を得意としますが、画像、テキスト、音声などの複雑なオブジェクト間の類似性を計算するのは苦手です。その解決策となるのが埋め込みです。
埋め込みは、機械学習 (ML) と自然言語処理 (NLP) の基本的な概念であり、複雑なデータをよりシンプルで理解しやすい形式に変換するための専門的な技術です。テキストや画像のような高次元の情報をコンパクトな数値のベクトルに変換することで、これを行います。このプロセスはたいてい、次元削減と呼ばれます。この変換により、モデルは、本質的に多数の属性を持つデータ (変換しないと解釈できないデータ) 内の根本的な意味と関係を捉えることができます。
簡単に言えば、埋め込みは複雑なデータを単純化し、管理しやすい形に変換することで、機械学習において重要な役割を果たします。これには、次のようなメリットがあります。
次元削減は、大規模なデータセットを低次元の表現に変換して単純化します。埋め込みは、重要な情報を失うことなく次元の数を減らし、データをより管理しやすくし、機械学習モデルの効率を向上させます。
埋め込みは、データの意味論的意味を捉え、モデルが複雑な関係を理解して解釈できるようにします。この機能は、モデルが言語の微妙なニュアンスを把握できるようにすることで、自然言語処理タスク (感情分析や機械翻訳など) を強化します。
大規模言語モデル (LLM) は、埋め込みから大きなメリットが得られます。埋め込みは、これらのモデルが人間が使うようなテキストを理解して生成するための基盤となります。単語やフレーズをベクトルとして表すことで、LLM (GPT モデルなど) は、文脈に応じた一貫性のある応答を生成できます。これにより、チャットボットや生成 AI (GenAI)などのアプリケーションの精度と関連性が向上します。
埋め込みを使用すると、t-SNE (t-distributed stochastic neighbor embedding) などの技術で、データクラスターと関係について、意味のある視覚的表現を作成できます。この可視化は、データパターンの理解、異常の検出、情報に基づいたビジネス上の意思決定に役立ちます。
機械学習アルゴリズムが効果的に機能するために処理できる必要がある複雑なデータにさまざまな種類があるように、データを表現する独自の方法を提供する埋め込みモデルにもさまざまな種類があります。最も一般的な埋め込みモデルには、次のようなものがあります。
PCA は、次元削減に使用される統計的手法です。データが最も変化する方向 (主成分とも呼ばれる) を特定し、その方向にデータを投影します。その結果、元のデータの重要な特徴を捉えた簡略化されたベクトルが生成され、分析がより管理しやすくなります。
Google が開発した word2vec は、単語の埋め込みを生成するニューラルネットワークベースのモデルです。大規模なテキストデータセットでトレーニングすることで、単語間の意味的関係を捉えます。Word2vec には、CBOW (Continuous Bag-of-Words Model) および skip-gram という 2 つの主要なバリエーションがあります。CBOW は文脈から目的とする単語を予測し、skip-gram は目的とする単語から文脈を予測します。どちらの方法も、単語の意味や関係を反映した複雑なベクトル表現を作成します。
SVD は、行列の因数分解で使われる手法で、大きな行列 (複雑なデータを表現するために使われる数値の配列) をよりシンプルで扱いやすい断片に分解するプロセスです。データの基盤となるパターンと関係を特定するには、行列の因数分解が必要です。SVD は、行列を他の 3 つの行列に分解し、元のデータの本質的な構造を捉えます。SVD は、テキストデータでの隠れた意味構造を見つけるために潜在意味分析 (LSA) でよく使用されます。これにより単語が一緒に出現することが少ない場合でも、モデルは単語間の類似性を理解することができます。
ベクトルは、コンピューターが処理しやすい形式でデータを表す数値のリストです。ベクトル内の各数値は、データの特定の属性や特徴に対応します。たとえば、機械学習モデルにおいて、ベクトルは使用頻度、文脈、意味論的意味などのさまざまな側面を捉えることで単語を表す場合があります。埋め込みにより複雑なデータをベクトルに変換することで (つまり、非数値データを数値データに変換することで)、モデルはデータ内の関係をより効果的に分析して見つけられるようになります。
埋め込みにおいてベクトルは、類似検索やパターン認識を可能にするため、非常に重要です。モデルがベクトルを処理するとき、多次元空間でどのベクトルが互いに近接しているかを識別することができます。この近接性は類似性を示し、モデルは類似のアイテムをグループ化できます。十分な大きさのデータセットがあれば、ML アルゴリズムは高次元のデータ関係を理解することが可能になります。
埋め込みは通常、特定のタスクで機械学習モデルをトレーニングする過程で作成されます。これには多くの場合、代理問題と呼ばれる教師あり問題の設定が含まれ、その主な目的は結果を予測することです。たとえば、モデルは一連のテキストの中で次に出現しそうな単語を予測する場合があります。この過程で、モデルは入力データを、基礎となるパターンと関係性を捉える埋め込みベクトルにエンコードすることを学習します。
ニューラルネットワークは、一般に埋め込みデータを生成するために使用されます。これらのネットワークは、複数の層で構成され、隠れ層の 1 つが入力特徴をベクトルに変換する役割を担っています。この変換は、手動で準備されたサンプルからネットワークが学習するときに発生します。エンジニアは、ネットワークに新しいデータを入力することでこのプロセスを導き、より多くのパターンを学習させて、より正確な予測を行えるようにします。時間が経つにつれて、埋め込みは洗練され、独立して動作するようになり、モデルはベクトル化されたデータのみに基づいて正確な推奨を行えるようになります。エンジニアは、追加のデータが導入されても効果を維持できるように、これらの埋め込みを監視して微調整し続けます。
埋め込みは汎用性が高く、さまざまなタイプのデータに適用でき、機械学習モデルのベクトルに変換して効率的に処理できます。埋め込み可能である一般的なオブジェクトは次のとおりです。
- 単語
単語の埋め込みは、テキストを数値ベクトルに変換し、単語間の意味関係を捉えます。これは、言語翻訳や感情分析などのタスクに不可欠です。 - 画像
画像埋め込みは、視覚データをベクトルに変換し、モデルが画像内のパターンや特徴を認識できるようにします。これは、顔認識や物体検出などのアプリケーションで使用されます。 - 音声
音声埋め込みは、音波をベクトルに変換し、モデルが音声言語、音楽、その他の音声信号を理解して処理できるようにします。これは、音声認識と音声分類のタスクに不可欠です。 - グラフ
グラフ埋め込みは、構造情報を保持しながら、グラフのノードとエッジをベクトルとして表します。これは、リンク予測、ノード分類、ソーシャルネットワーク分析などのタスクに役立ちます。
前述したように、埋め込みとは通常、テキスト、画像、グラフなどのオブジェクトをベクトル (数値の配列) に変換することを意味します。これらのベクトルにより、モデルはデータ内の類似性とパターンを認識できます。
推奨システムでは、埋め込みはユーザーとアイテムを高次元空間のベクトルとして表現するのに役立ちます。各ユーザーとアイテムには、過去のやり取りを通じて学習された埋め込みベクトルがアサインされます。ユーザーとアイテムのペアに対する推奨スコアは、ベクトルのドット積を取ることで計算されます。スコアが高いほど、ユーザーがそのアイテムに興味を持つ可能性は高くなります。このアプローチでは、ユーザーの好みやアイテムの特性を捉え、パーソナライズされた推奨を可能にします。
テキスト埋め込みの動作は異なります。これらは、LLM の事前トレーニングプロセスの一環として学習されます。これらのモデルは、事前トレーニング時に膨大な量のテキストを学習するので、単語、フレーズ、文の間の文脈的関係を特定できるようになります。このモデルは、他の特定の単語やさまざまな文脈で出現する頻度に基づいて、各単語や語句に固有のベクトルを割り当てます。このプロセスにより、モデルはテキスト内の同義語や関係など、意味上のニュアンスを捉えることができます。これは、モデルが人間の言語を理解し、生成し、正確に処理するのに役立ちます。
埋め込みは機械学習において幅広い用途があり、さまざまなタスクに不可欠です。注目すべき例は以下のとおりです。
- コンピュータービジョン
埋め込みは、画像を数値ベクトルに変換するために使用され、画像内の本質的な特徴やパターンを捉えます。この変換により、画像分類、オブジェクト検出、顔認識などのタスクが可能になります。 - 推奨システム
埋め込みは、ユーザーとアイテム (映画や製品など) をベクトルとして表現するのに役立ちます。これらのベクトルは、ユーザーの嗜好やアイテムの特徴を反映する潜在的特徴を捉えます。ユーザーとアイテムの埋め込みの類似性を比較することで、推奨システムはユーザーが興味を持ちそうなアイテムを予測できます。 - セマンティック検索
セマンティック検索は、埋め込みを使用して、キーワードの一致だけに頼るのではなく、クエリの文脈と意味を理解することで、検索結果を改善します。埋め込みは、検索クエリとドキュメントの両方をベクトルに変換するため、検索システムはユーザー要求と意味的に類似したドキュメントを見つけることができます。 - インテリジェントなドキュメント処理
インテリジェントなドキュメント処理では、埋め込みはテキストデータを、テキスト内の意味と関係を捉えるベクトルに変換するのに役立ちます。これは、ドキュメントの分類、感情分析、情報抽出などのタスクに役立ちます。埋め込みを使用することで、モデルはドキュメントの内容をよりよく理解して処理できます。
埋め込みは機械学習における革新的なツールであり、複雑なデータの単純化と理解を可能にします。組織は、ServiceNow の高度な AI ソリューションを使用して、この機能を活用できます。
ServiceNow は、プラットフォーム内に埋め込みを実装するための包括的な機能を提供します。ServiceNow の AI を活用したアプリケーションは、高度な埋め込みモデルを活用して、チケットを自動的に分類してルーティングし、問題が発生する前に予測し、パーソナライズされた推奨を提供します。この統合により、あらゆる業界の企業がデータの可能性を最大限に活用できるようになります。
ServiceNow が埋め込みに対する適切なアプローチによってデータ処理機能を変革する方法をご覧ください。今すぐデモを予約して、AI がどのようにビジネスオペレーションを強化できるかをご確認ください。