生成AIパスポート試験 キーワード解説
このドキュメントは、「生成AIパスポート試験」のシラバス(2025年2月試験より適用)に基づき、各学習項目の主要なキーワードについて簡潔に解説したものです。
公式テキストの完全な代替ではなく、試験対策の補助として、重要な概念や用語の理解を深める目的で作成されています。
AI分野は進化が速いため、常に最新の情報を確認し、この解説と合わせて公式テキストや他の学習資料を活用することをお勧めします。
あなたの学習の一助となれば幸いです。
目次
- 第1章 AI(人工知能)
- 第2章 生成AI(ジェネレーティブAI)
- 第3章 現在の生成AI(ジェネレーティブAI)の動向
- 第4章 情報リテラシー・基本理念とAI社会原則
- 第5章 テキスト生成AIのプロンプト制作と実例
第1章 AI(人工知能)
AI(人工知能)の定義
- AIとは:
「人工知能」(Artificial Intelligence: AI)は、人間が持つ知的な能力、特に学習、推論、判断、問題解決などをコンピュータ上で実現しようとする科学技術の分野全体を指します。単なる機械的な動作ではなく、状況に応じて自律的に最適な行動を選択する能力を目指しています。- ダートマス会議: 1956年の夏にアメリカのダートマス大学で開催された研究会で、「人工知能」という言葉が初めて公式に提唱されました。この会議はAI研究の出発点として歴史に刻まれています。
- ダートマス会議: 1956年の夏にアメリカのダートマス大学で開催された研究会で、「人工知能」という言葉が初めて公式に提唱されました。この会議はAI研究の出発点として歴史に刻まれています。
- AIとロボットの区別:
AIは「知能」そのもの、つまりコンピュータプログラムやアルゴリズムによって実現される思考プロセスや意思決定の能力を指します。一方、ロボットは、そのAIを搭載し、物理的な環境で動作する「身体」を持つ機械のことです。AIはロボットの「頭脳」や「司令塔」として機能し、ロボットに自律的な行動を可能にします。
AIに知能をもたらす仕組み
- 知能をもたらす2つの仕組み:
AIが特定のタスクをこなすための主要なアプローチとして、「ルールベース」と「機械学習」の二つが挙げられます。
- ルールベースとは:
人間が事前に定義した明確な規則(IF-THENルールなど)に基づいて、コンピュータが判断や処理を行う手法です。例えば、「もし気温が25度を超えたら、冷房をつける」といったように、条件と結果を直接プログラムします。複雑な状況への対応は難しいですが、ルールが明確な分野では高い精度を発揮します。
- 機械学習とは:
AIに知能をもたらす中核的な技術の一つで、コンピュータが大量のデータからパターンや規則性を自動的に「学習」し、その学習結果に基づいて新たなデータに対する予測や判断を行う手法です。人間が明示的にプログラミングするのではなく、データから自ら学ぶ点が特徴です。- 学習済みモデル: 機械学習プロセスを経て、特定のタスクを実行できる状態になったAIシステム(プログラムと学習済みのパラメータの集合)を「学習済みモデル」と呼びます。これは、いわばAIが「知識」を身につけた状態です。
- 教師あり学習: 最も一般的な機械学習の手法で、入力データとそれに対応する正しい答え(「ラベル」とも呼ばれます)のペアをAIに与えて学習させます。例えば、たくさんの猫と犬の画像にそれぞれ「猫」「犬」という正解ラベルを付けて学習させることで、新しい画像が猫か犬かをAIが判別できるようになります。分類(例:スパムメール判別)や回帰(例:株価予測)などに使われます。
- 教師なし学習: 正解データを与えずに、AI自身が入力データの中に隠されたパターンや構造、類似性などを発見して学習する手法です。未知のデータから新しい発見をしたり、データを整理したりするのに役立ちます。
- クラスタリング: 教師なし学習の代表的な手法で、似た特徴を持つデータ同士を自動的にグループ(クラスター)にまとめることを目的とします。顧客の購買履歴から趣味嗜好が似たグループを見つけ出す、などが例です。
- 次元削減: データが持つ多くの特徴量(次元)の中から、重要な情報だけを残して次元数を減らす手法です。データの可視化を容易にしたり、モデルの計算負荷を軽減したりする効果があります。
- 強化学習: AIが特定の環境内で「エージェント」として行動し、その行動の結果として得られる報酬(正のフィードバック)や罰則(負のフィードバック)に基づいて、最適な行動戦略を自律的に学習していく手法です。囲碁のAI「AlphaGo」やロボット制御、ゲームの攻略などに用いられます。試行錯誤を通じて最適な行動を見つけ出すのが特徴です。
- 半教師あり学習: 少量のラベル付きデータ(正解データがあるデータ)と大量のラベルなしデータ(正解データがないデータ)を組み合わせて学習する手法です。教師あり学習と教師なし学習の良いとこ取りをしたアプローチと言えます。ラベル付けの手間を減らしつつ、学習性能を向上させることが期待されます。
- ノーフリーランチ定理: 「どんな問題に対しても、常に最も優れた性能を発揮する万能な機械学習アルゴリズムは存在しない」という定理です。つまり、ある問題で優れた性能を示すアルゴリズムが、別の問題でも同じように優れているとは限らず、問題の種類に応じて最適なアルゴリズムを選択する必要があることを示唆しています。
- ニューロン、シナプス、人工ニューロン(ノード)、ニューラルネットワーク:
人間の脳は、神経細胞である「ニューロン」が「シナプス」という接続部を介して複雑に結合し、情報を伝達することで知的な活動を行っています。この脳の仕組みをコンピュータ上で模倣したものが「人工ニューロン(ノード)」であり、これらの人工ニューロンが多数結合して層状に情報を処理する構造が「ニューラルネットワーク」です。 - ディープラーニング(深層学習):
ニューラルネットワークの層を何層にも深く重ねることで、より複雑で抽象的な特徴をデータから自動的に学習できるようにした機械学習の手法です。画像認識、音声認識、自然言語処理などの分野で目覚ましい進歩をもたらしました。 - 重み、情報の重みづけ: ニューラルネットワークにおいて、ある人工ニューロンから次の人工ニューロンへ情報が伝達される際に、その情報の重要度を調整する係数を「重み」と呼びます。この「重み」を適切に調整する(情報の重みづけをする)ことが、学習の成功に不可欠です。学習は、この重みを最適化するプロセスと言えます。
- 過学習(オーバーフィッティング):
AIモデルが、学習に用いたデータ(学習データ)に過剰に適合しすぎてしまい、学習データ以外の新しい未知のデータに対しては、正確な予測や判断ができなくなる現象です。例えるなら、テストの過去問だけを完璧に覚えてしまい、類題や応用問題に対応できない状態です。 - 過学習を避ける手法:
過学習はモデルの汎用性を損なうため、様々な対策が取られます。- 正則化: モデルが複雑になりすぎるのを防ぐために、学習時にペナルティを加える手法です。これにより、モデルが特定のデータに過剰にフィットするのを抑制します。
- ドロップアウト: ニューラルネットワークの学習時に、ランダムに一部の人工ニューロン(ノード)の信号を無効にする手法です。これにより、特定のニューロンに依存しすぎることを防ぎ、複数の経路で情報を処理するよう促し、過学習を抑制します。
- 転移学習:
ある特定のタスク(例えば、一般的な画像認識)で既に大量のデータを用いて学習が完了しているモデルの一部を、別の関連するタスク(例えば、特定の病気の画像診断)に再利用する手法です。ゼロから学習するよりも効率的で、少ないデータでも高い性能を達成できる利点があります。
AIの種類
- 弱いAI (ANI) と強いAI (AGI):
AIは、その能力の汎用性によって大きく2つに分類されます。- 弱いAI (ANI: Artificial Narrow Intelligence): 特定の限られたタスクのみに特化したAIのことです。現在の私たちの身の回りにあるAIのほとんどがこれに該当します。例えば、顔認識、音声認識、翻訳アプリ、天気予報、レコメンデーションシステムなどが挙げられます。与えられた範囲のタスクは非常に高い精度でこなしますが、それ以外のタスクは実行できません。
- 強いAI (AGI: Artificial General Intelligence): 人間のように多様なタスクをこなし、状況に応じて自律的に学習・推論・判断ができる、汎用的な知性を持つAIのことです。まだSFの世界の話であり、現在の技術では実現されていません。人間と同じように思考し、あらゆる知的タスクを実行できることを目指します。
AIの歴史
- AIブームの変遷:
AI研究の歴史は、期待と停滞を繰り返しながら進化してきました。- 第一次AIブーム (1950年代後半~1960年代):
ダートマス会議でAIの概念が誕生し、探索(迷路を解くなど)や推論(論理的な問題を解くなど)といった記号処理アプローチが中心でした。シンプルな問題解決には成功しましたが、現実世界の複雑な問題には対応できませんでした。 - 第二次AIブーム (1980年代):
特定の専門分野の知識をルールとしてコンピュータに記述する「エキスパートシステム」が注目を集めました。医療診断や金融アドバイスなどで実用化もされましたが、知識の記述に莫大な手間がかかることや、常識的な知識の表現が難しいことなどから限界が見え、「AIの冬」と呼ばれる研究の停滞期に入ります。 - 第三次AIブーム (2000年代後半~現在):
インターネットの普及による「ビッグデータ」の利用可能性の拡大、コンピュータの処理能力(特にGPU)の飛躍的な向上、そして機械学習、特に「ディープラーニング」の技術的なブレイクスルーが重なり、現在のAIの隆盛につながっています。画像認識、音声認識、自然言語処理などで人間を超える性能を発揮するAIが登場し、幅広い分野で活用されています。
- 第一次AIブーム (1950年代後半~1960年代):
シンギュラリティ (技術的特異点)
- シンギュラリティとは:
AIが自ら学習し、改良を重ねることで、人間の知能を根本的に超えるような時点のことを「シンギュラリティ(技術的特異点)」と呼びます。これは、AIがAI自身を開発・改善できるようになり、その進化の速度が人間には予測不能なレベルに達するという概念です。
- 2045年問題: アメリカの未来学者レイ・カーツワイル氏などが提唱しているもので、AIが人間の知能を超える時期が2045年頃に到来する可能性を指摘しています。
第2章 生成AI(ジェネレーティブAI)
生成AI(ジェネレーティブAI)とは
- 生成モデルの誕生:
生成AIは、既存のデータから学習し、その特徴を捉えて新しいデータを「生成」するAIのことです。従来のAIが主に識別に使われていたのに対し、生成AIは創造的な能力を持ちます。- ボルツマンマシン、制約付きボルツマンマシン: 確率的なモデルであり、生成AIの初期の研究で重要な役割を果たしました。データのパターンを学習し、新しいデータを生成する能力を持ちます。
- ボルツマンマシン、制約付きボルツマンマシン: 確率的なモデルであり、生成AIの初期の研究で重要な役割を果たしました。データのパターンを学習し、新しいデータを生成する能力を持ちます。
- 自己回帰モデルとディープラーニング(深層学習):
* 自己回帰モデル: 系列データにおいて、過去のデータに基づいて次のデータを予測・生成するモデルです。テキスト生成などで用いられます。 * ディープラーニング(深層学習): 生成AIの進化を支える核となる技術で、複雑な多層のニューラルネットワークを用いてデータから特徴を自動的に学習します。
- CNN (畳み込みニューラルネットワーク):
主に画像認識に用いられるディープラーニングのモデルですが、画像生成にも応用されます。「畳み込み」という処理を行い、画像の局所的な特徴を効率的に捉えます。- 畳み込み: 画像データから特徴を抽出する処理。フィルター(カーネル)を画像に適用し、特徴マップを生成します。
- 畳み込み: 画像データから特徴を抽出する処理。フィルター(カーネル)を画像に適用し、特徴マップを生成します。
- VAE (変分自己符号化器):
画像を圧縮・復元する「自己符号化器」に、潜在空間の分布を正規化する仕組みを加えた生成モデルです。潜在空間からランダムなベクトルをサンプリングすることで、多様な画像を生成できます。- ノイズ: VAEでは、潜在空間でノイズを加えることで、生成されるデータの多様性を高めます。
- エンコーダ、デコーダ: エンコーダが入力データを潜在空間の表現に圧縮し、デコーダがその潜在表現から元のデータを復元(生成)します。
- 潜在ベクトル: データの特徴を抽象的に表現した低次元のベクトル。
- GAN(敵対的生成ネットワーク):
「生成器(Generator)」と「識別器(Discriminator)」という2つのネットワークが互いに競い合いながら学習することで、非常にリアルなデータを生成するモデルです。- 生成器: ランダムなノイズから偽のデータを生成しようとします。
- 識別器: 入力されたデータが本物か偽物かを区別しようとします。生成器は識別器を騙せるようなデータを、識別器は本物と偽物を見分けられるように学習が進みます。
- RNN(回帰型ニューラルネットワーク):
系列データ(時間的順序を持つデータ、例:文章、音声)の処理に特化したニューラルネットワークです。過去の情報を記憶して次の予測に利用できます。- 隠れ層: RNNの内部で情報を処理する層。
- リカレントニューラルネットワーク: RNNの別名。
- シーケンスデータ: 時間的な順序や連続性を持つデータ。
- LSTM(長・短期記憶):
RNNの一種で、長い時系列データにおける情報の長期的な依存関係を学習する能力に優れています。従来のRNNが抱える勾配消失問題などを解決し、より長い文章や音声を扱えるようになりました。
- Transformerモデル:
自然言語処理分野に革命をもたらした画期的なモデルです。RNNのような時系列処理ではなく、「Attention(注意)メカニズム」を用いて、系列データ内の異なる位置にある情報間の関係性を直接捉えることができます。並列処理が可能で、大規模なデータセットでの学習に適しています。- Attention: 系列データ内の異なる位置にある要素間の関連性の強さを計算し、重要な情報に「注意」を向けるメカニズム。
- 自己注意力(Self-Attention): 入力シーケンス内で、各単語が他のすべての単語とどれだけ関連しているかを計算するAttentionメカニズム。
- Attention Mechanism: 注目すべき部分に焦点を当てる仕組み全般。
- 位置エンコーディング: TransformerはRNNのように順序を考慮しないため、入力シーケンスにおける単語の「位置」情報をモデルに伝えるための仕組み。
- アーキテクチャ: モデルの内部構造や設計のこと。
- GPTモデル: OpenAIが開発したTransformerベースの大規模言語モデル(LLM)シリーズ。Generative Pre-trained Transformerの略で、大量のテキストデータで事前学習され、高い文章生成能力を持ちます。
- BERTモデル: Googleが開発したTransformerベースのモデル。GPTと異なり、文章の前後関係を双方向から学習する特徴を持ちます。
- MLM (Masked Language Model): BERTの学習タスクの一つで、文章中の単語の一部を隠し(マスクし)、そのマスクされた単語を予測させることで言語理解能力を高めます。
- NSP (Next Sentence Prediction): BERTの学習タスクの一つで、2つの文章が連続しているかどうかを予測させることで、文章間の関係性を学習します。
- ROBERTa、ALBERT (a Lite BERT): BERTの派生モデルで、学習効率や性能を向上させたものです。
ChatGPT
- ChatGPTとは:
OpenAIが開発した大規模言語モデルGPTを基にした対話型AIです。人間が話すような自然な言葉で質問に答えたり、文章を生成したり、翻訳したりすることができます。
- 対話型AIの変遷とChatGPTの歴史:
* GPT-1: Transformerベースの最初のモデル。 * GPT-2: パラメータ数が増え、より自然な文章生成が可能に。 * GPT-3: 大幅に性能が向上し、多様なタスクに対応できるようになった。 * GPT-3.5: InstructGPTなど、人間のフィードバックを取り入れて性能を向上させたバージョン。 * GPT-4: 高い推論能力と創造性を持ち、マルチモーダル(テキストだけでなく画像も扱える)な能力も備える。 * Code Interpreter (現 Advanced Data Analysis): データ分析やプログラミングコードの実行が可能な機能。 * GPTS (GPTs): ユーザーが特定の目的に合わせてカスタマイズできるGPTモデル。 * GPT-4o: 音声、視覚、テキストの入出力を高速かつ自然に処理できる最新のマルチモーダルモデル。- 自然言語処理(NLP): 人間が使う自然言語をコンピュータで処理・分析する技術。
- パラメータ: AIモデルが学習によって調整する内部的な数値のこと。パラメータ数が多いほど、複雑なパターンを学習できる可能性がある。
- データセット: AIの学習に用いられる大量のデータのこと。
- RLHF (Reinforcement Learning from Human Feedback): 人間のフィードバックによる強化学習。人間の評価を報酬としてモデルを最適化し、より人間にとって自然で役立つ応答を生成できるようにする技術。
- アライメント (Alignment): AIの行動や目標を人間の価値観や意図に合致させること。
- ファインチューニング: 事前学習されたモデルを、特定のタスクやデータセットに合わせてさらに微調整すること。
- ハルシネーション (Hallucination): 生成AIが、事実ではない情報をあたかも事実であるかのように生成してしまう現象。「幻覚」とも呼ばれます。
- マルチモーダル: テキストだけでなく、画像、音声、動画など複数の種類のデータを扱える能力のこと。
生成AIが出来ることと主なサービス
- テキスト生成AI:
文章の生成、要約、翻訳、校正、アイデア出し、メール作成、コード生成など、幅広いテキスト関連のタスクを実行できます。- Claude: Anthropic社が開発した大規模言語モデル。倫理と安全性に重点を置いている。
- Gemini: Googleが開発した高性能なマルチモーダルモデル。
- 画像生成AI:
テキスト記述から画像を生成したり、既存の画像を編集・加工したりすることができます。- 画像のリサイズ、正規化、データの水増し (augmentation)、データ拡張技術: 画像処理や機械学習におけるデータ準備の技術。データの多様性を増やし、モデルの汎用性を高める。
- 画像のリサイズ、正規化、データの水増し (augmentation)、データ拡張技術: 画像処理や機械学習におけるデータ準備の技術。データの多様性を増やし、モデルの汎用性を高める。
- 音楽生成AI:
テキストやその他の入力に基づいて、新しい音楽を生成したり、既存の音楽をアレンジしたりできます。- リマスタリング: 既存の音源の音質を向上させる処理。
- リマスタリング: 既存の音源の音質を向上させる処理。
- 音声生成AI:
テキストから人間の声に似た音声を生成したり、既存の音声のスタイルを変更したりできます。
- 動画生成AI:
テキスト記述や画像から動画を生成したり、既存の動画を編集したりする技術です。- Sora: OpenAIが開発したテキストから高品質な動画を生成するモデル。
- Runway Gen-3: Runway MLが開発した動画生成AI。
- Luma Dream Machine: Luma AIが開発したテキストや画像から動画を生成するモデル。
第3章 現在の生成AI(ジェネレーティブAI)の動向
ディープフェイク (深層偽造) 技術
- ディープフェイクとは:
AI、特にディープラーニング技術を用いて、画像や動画、音声を非常に巧妙に加工し、あたかも本物であるかのように見せかける技術です。- 偽情報(ディスインフォメーション): ディープフェイクは、意図的に誤解を招くような偽情報を拡散するツールとして悪用される危険性があります。
- 偽情報(ディスインフォメーション): ディープフェイクは、意図的に誤解を招くような偽情報を拡散するツールとして悪用される危険性があります。
- ディープフェイクによる事件:
政治家や有名人の偽の動画を作成し、誤解を招く発言をさせたり、詐欺や名誉毀損に悪用されたりする事例が世界中で報告されています。これは、信頼性の問題や社会的な混乱を引き起こす可能性があります。
AIに関する動向
- AIが人間の仕事を奪う、または代替するという懸念:
AI技術の発展により、一部の定型的な業務や肉体労働がAIやロボットに代替される可能性が指摘されています。これにより、雇用の変化や新たなスキルの必要性が生じるという懸念があります。 - 新しい仕事が生まれる可能性:
一方で、AIの登場によって、AI開発者、AIトレーナー、AI倫理学者、プロンプトエンジニアなど、AIに関連する新たな職業が生まれることも期待されています。AIは既存の仕事を効率化し、人間はより創造的で複雑な仕事に集中できるようになるという見方もあります。 - AIによる差別と偏見:
AIの学習データに社会の既存の偏見や差別が含まれている場合、AIがその偏見を学習し、不公平な判断や差別的な結果を生成する可能性があります。例えば、採用システムにおける性別や人種による偏り、犯罪予測における特定の集団への過剰な監視などが挙げられます。- データセット: AIの学習に用いられるデータの集合。偏ったデータセットは、AIの偏見の原因となる。
- AI監査(AI Audit): AIシステムの公平性、透明性、信頼性などを評価・検証するプロセス。AIによる差別や偏見を特定し、改善するために行われる。
- AIの活用がもたらす問題:
AIの急速な普及は、プライバシー侵害、ハルシネーション(誤情報の生成)、セキュリティリスク、倫理的な問題など、新たな課題を生み出しています。- AI倫理(AI Ethics): AIの開発、展開、利用における倫理的原則や価値観を研究する分野。公平性、透明性、責任などが主要なテーマ。
- 説明可能なAI(Explainable AI: XAI): AIの意思決定プロセスや結果の理由を人間が理解できるように説明する技術や研究分野。AIの「ブラックボックス」問題を解消し、信頼性を高めることを目指す。
- AIの開発競争と国際的な動向:
世界中でAIの開発競争が激化しており、各国政府や企業が多額の投資を行っています。これにより、AI技術の進化は加速し、国際的な連携や規制の議論も活発になっています。- AIの覇権争い: 各国がAI技術開発で優位に立つことを目指す競争。
- 規制の動き: 各国・地域でAIの悪用を防ぎ、安全な利用を促進するための法規制やガイドラインの策定が進められている(例:EUのAI規制法案)。
- AIに関する法整備の現状:
AIに関する法整備はまだ発展途上にあり、既存の法律(著作権法、個人情報保護法など)の解釈がAIに適用されるか、新たな法律が必要かなど、議論が活発に行われています。 - 倫理と法整備が追いつかない問題:
AI技術の進歩が非常に速いため、その技術が社会にもたらす倫理的・法的課題の検討や、それに対応する法整備が追いつかないという問題が発生しています。
第4章 情報リテラシー・基本理念とAI社会原則
インターネットリテラシー
- インターネットリテラシーとは:
インターネットを安全に、そして効果的に利用するために必要な知識、スキル、態度、倫理観の総称です。情報の真偽を判断する能力や、プライバシー保護の意識などが含まれます。- テクノロジーの理解: インターネットや関連技術の基本的な仕組みを理解すること。
- 情報リテラシー: 情報の信頼性を評価し、適切に利用する能力。
- セキュリティとプライバシー: ネット上のリスクを理解し、個人情報やデバイスを保護する意識。
- デジタル市民権: デジタル社会の一員として、責任ある行動を取る意識。
- 利用者の興味を引くフィッシング詐欺:
銀行や有名企業を装い、偽のウェブサイトに誘導して個人情報やパスワードをだまし取ろうとする詐欺の手法です。利用者の興味を引くような件名や内容(例:「アカウントがロックされました」「荷物のお届け通知」)でメールやメッセージを送ってきます。
セキュリティとプライバシー
- 悪意のあるQRコード:
偽のQRコードをスキャンさせ、不正なウェブサイトに誘導したり、マルウェアをダウンロードさせたりする手口です。
- Wi-Fiに潜む罠:
公共の無料Wi-Fiの中には、セキュリティが脆弱であったり、悪意のあるアクセスポイントであったりする場合があります。これにより、通信内容が盗聴されたり、個人情報が漏洩したりする危険性があります。
- アップロードサービスに潜む詐欺:
ファイルをアップロードするサービスを装って、個人情報やクレジットカード情報を不正に入手しようとする詐欺があります。
- 不適切なコンテンツへのWebアクセス:
未成年者にとって有害なコンテンツや、違法なコンテンツに意図せずアクセスしてしまうリスクがあります。
- ソーシャルエンジニアリング攻撃:
技術的な脆弱性を突くのではなく、人間の心理的な隙や行動の習慣を突いて、パスワードなどの機密情報を不正に入手する手法です。- スピアフィッシング: 特定の個人や組織を標的とした、より巧妙なフィッシング詐欺。
- ベイト攻撃: USBメモリなどをわざと落としておき、拾った人がPCに差し込むことでマルウェアを感染させる手口。
- ブラックメール: 個人情報や秘密を暴露すると脅して金銭などを要求する行為。
- プレテキスト: 信頼できる人物や状況を装って情報を聞き出す詐欺。
- プライバシー設定:
SNSや各種サービスのプライバシー設定を適切に行い、個人情報の公開範囲を制限することが重要です。
- 生成AIの技術的発展に潜む脅威:
生成AIの発展により、ディープフェイクのような偽情報生成が容易になったり、悪用されるリスクが増大したりする可能性があります。- フィッシング詐欺: 偽のメールやウェブサイトで個人情報をだまし取る。
- スミッシング: SMS(ショートメッセージサービス)を利用したフィッシング詐欺。
- ヴィッシング: 音声通話を利用したフィッシング詐欺。
- マルウェア: 悪意のあるソフトウェアの総称(ウイルス、ワーム、トロイの木馬など)。
- アンチウイルスソフトウェア: マルウェアの検出・除去を行うソフトウェア。
- ランサムウェア: コンピュータのデータを暗号化し、復元と引き換えに身代金を要求するマルウェア。
個人情報保護の観点
- 個人情報保護法:
個人の権利と利益を保護するため、個人情報を取り扱う事業者に対して義務を課している法律です。- 改正個人情報保護法: 時代の変化に合わせて定期的に改正が行われます。
- 個人情報保護委員会: 個人情報保護法を執行する独立した機関。
- 個人情報取扱事業者: 個人情報データベース等を事業の用に供する者。
- 個人情報の詳細な定義:
氏名、生年月日、住所など、特定の個人を識別できる情報、および他の情報と容易に照合でき、それによって個人を識別できる情報が含まれます。- 個人識別符号: 指紋データ、顔認識データ、パスポート番号など、特定の個人を識別できる固有の記号や番号。
- 個人識別符号: 指紋データ、顔認識データ、パスポート番号など、特定の個人を識別できる固有の記号や番号。
- 要配慮個人情報:
人種、信条、病歴、犯罪の経歴、犯罪被害に関する情報など、不当な差別や偏見が生じやすい性質を持つ個人情報で、特に慎重な取り扱いが求められます。- 機微 (センシティブ) 情報: 要配慮個人情報とほぼ同義で、取り扱いに特に注意が必要な情報。
- 機微 (センシティブ) 情報: 要配慮個人情報とほぼ同義で、取り扱いに特に注意が必要な情報。
- 匿名加工情報:
特定の個人を識別できないように、かつ復元できないように加工された個人情報のことです。ビジネスでのデータ活用を促進しつつ、個人のプライバシーを保護するために設けられた制度です。- マスキング: 匿名加工情報を作成する際の手法の一つで、個人を特定できる情報を隠したり、置き換えたりすること。
- マスキング: 匿名加工情報を作成する際の手法の一つで、個人を特定できる情報を隠したり、置き換えたりすること。
- 生成AI活用における個人情報の取り扱い:
生成AIに個人情報を含むデータを入力する際は、情報漏洩や誤用リスクを考慮し、適切な匿名化や利用制限を行う必要があります。例えば、企業の機密情報や顧客の個人情報を安易にAIに入力しないなどの注意が必要です。
制作物に関わる権利
- 知的財産権:
人間の知的活動によって生み出された創造物に関する権利の総称です。- 著作権: 文学、音楽、美術、プログラムなど、思想や感情を創作的に表現したものに与えられる権利。創作した時点で自動的に発生します。
- 特許権: 発明(新しい技術的思想)を保護する権利。出願し審査を経て取得。
- 商標権: 商品やサービスの名称、ロゴなどを保護する権利。出願し審査を経て取得。
- 意匠権: 物品のデザイン(形状、模様、色彩など)を保護する権利。出願し審査を経て取得。
- 生成AI活用における知的財産権:
生成AIが作り出したコンテンツの著作権の帰属や、学習データに既存の著作物を使用することの適法性など、新たな法的課題が生じています。
- 肖像権とパブリシティ権:
* 肖像権: 自分の顔や姿がみだりに撮影されたり、公表されたりしない権利。プライバシー権の一部。 * パブリシティ権: 有名人の氏名や肖像が持つ経済的価値を保護する権利。無断で利用して商業利用されることを防ぐ。
- 生成AI活用における肖像権とパブリシティ権:
生成AIで実在の人物に似た画像や動画を作成する際、本人の許諾なく作成・公開すると、これらの権利を侵害する可能性があります。
- 不正競争防止法:
事業者間の公正な競争を確保するための法律で、営業秘密の不正取得、誤認させる表示、他者の信用を毀損する行為などを規制します。- 営業秘密: 企業にとって有用な技術上または営業上の情報で、秘密として管理され、公然と知られていないもの。
- 限定提供データ: 事業者が限定された者に提供する情報で、不正競争防止法で保護される場合があります。
- 生成AI活用における不正競争防止法:
生成AIを用いて他社の営業秘密を不正に取得したり、他社の製品やサービスと混同させるようなコンテンツを作成したりする行為は、この法律に抵触する可能性があります。
- AI生成物に関する権利:
AIが生成したコンテンツの著作権は、現在の日本の法律では「人間の創作物」に限られるため、AI自身には認められません。基本的にはAIを操作・指示した人間に帰属すると考えられますが、創作性の度合いなどによって解釈が分かれる場合があります。
- AI生成物に関する事実確認:
AIが生成した情報には「ハルシネーション」のリスクがあるため、AI生成物の事実関係は必ず人間が確認する必要があります。
- AI生成物が既存の権利を侵害する可能性:
AIが学習したデータに含まれる著作物や肖像権、商標権などを、生成したコンテンツが無意識に模倣・再現してしまい、既存の権利を侵害する可能性があります。- 著作権侵害: 著作権者の許諾なく著作物を利用すること。
- 名誉棄損: 公然と事実を摘示し、他人の名誉を傷つけること。
- AI生成物の著作権の所在:
現在の日本の著作権法では、著作物は「思想又は感情を創作的に表現したもの」と定義されており、これは人間の行為によって生み出されることを前提としています。そのため、AIが自律的に生成したコンテンツには著作権は発生しないと解釈されています。AIを使って人間が生成したコンテンツの著作権は、その人間の創作性に応じて認められる可能性があります。
AIを取り巻く理念と原則・ガイドライン
- AI社会の基本理念:
AI技術が社会に浸透する中で、人間中心の考え方に基づき、持続可能で多様な社会を実現するための基本的な考え方です。- 人間の尊厳が尊重される社会 (Dignity): AIが人間の尊厳を損なうことなく、個人の尊重と自由を確保する社会。
- 多様な背景を持つ人々が多様な幸せを追求できる社会(Diversity & Inclusion): AIが特定の集団に偏見を持たず、誰もが恩恵を受けられる公平な社会。
- 持続可能な社会(Sustainability): AIが環境や社会に悪影響を与えず、長期的に発展できる社会。
- AI社会原則:
AIを開発・利用する上で遵守すべき行動規範や倫理的な指針。- 人間中心の考え方: AIはあくまで人間の活動を支援するツールであり、人間の意思決定を尊重し、人間が制御できる範囲で利用されるべきであるという原則。
- 安全性・公平性: AIシステムが安全で信頼性が高く、差別や偏見なく公平に機能すること。
- プライバシー保護、セキュリティ確保: AIの利用において個人情報や機密情報が適切に保護され、サイバー攻撃から守られること。
- 透明性、アカウンタビリティ: AIの判断プロセスが理解可能であり(透明性)、その結果に対して責任の所在が明確であること(アカウンタビリティ)。
- 教育・リテラシー: AIを適切に利用するための知識やスキルを広く普及させること。
- 公正競争確保、イノベーション: AI分野における健全な競争と技術革新を促進すること。
- 共通の指針:
AIの利活用全般にわたって、AI開発者、AI提供者、AI利用者というAIに関わるすべての主体が共通して考慮すべき指針。例えば、透明性、説明可能性、安全性などが含まれます。
- 高度なAIシステムに関係する事業者に共通の指針:
特に影響力の大きい、高度なAIシステム(例:大規模言語モデルなど)を開発・提供する事業者に対して、より厳格な責任や指針が求められることを示しています。リスク評価や対策の強化などが含まれます。
- AIガバナンスの構築:
AIを安全かつ倫理的に開発・運用するための管理体制や枠組みを組織内に構築すること。リスク管理、倫理規定の策定、社内教育などが含まれます。- AIガバナンス・ゴール: AIガバナンスが目指す目標。
- AIマネジメントシステム: AIガバナンスを継続的に運用するためのシステム。
- AIの事業活動を担う3つの主体:
AIを社会で活用する上で、それぞれ異なる役割と責任を持つ主体が存在します。- AI開発者(AI Developer): AIモデルやアルゴリズムを開発する者(例:OpenAI、Googleなど)。
- AI提供者(AI Provider): 開発されたAIモデルをサービスとして提供する者(例:クラウドサービス提供者)。
- AI利用者(AI Business User): 開発・提供されたAIサービスを自身の事業活動に組み込んで利用する者。
第5章 テキスト生成AIのプロンプト制作と実例
LMとLLM
- LM (Language Model:言語モデル):
単語の並びの確率を計算し、次に来る単語を予測するモデルです。文章の生成や、未完成の文章を補完するのに使われます。- n-gramモデル: 直前のn個の単語に基づいて次の単語の出現確率を予測するシンプルな言語モデル。
- ニューラル言語モデル: ニューラルネットワークを用いて単語間の複雑な関係性を学習し、より高度な言語理解と生成を行うモデル。
- LLM (Large Language Model:大規模言語モデル):
膨大な量のテキストデータ(通常、ウェブ上のテキスト、書籍など)と、非常に多くのパラメータ(モデルが学習によって調整する内部的な数値)を持つ言語モデルです。多様なタスクに対応でき、人間のような自然な文章生成能力を持ちます。- プレトレーニング: 大規模なデータセットで、教師なし学習的に(例:次の単語予測、穴埋め問題など)モデルを学習させること。これにより、汎用的な言語理解能力を獲得します。
- ハイパーパラメータ: モデルの学習プロセスを制御するための設定値。学習率やバッチサイズなど、学習前に人間が設定します。
- Temperature: 生成AIの応答の「ランダム性」や「多様性」を制御するハイパーパラメータ。値が高いほどランダムで創造的な応答になり、低いほど一貫性のある保守的な応答になります。
- Top-p (Nucleus Sampling): 確率の高い単語から順に、合計確率が一定の値(p)になるまで単語を選択し、その中からランダムに単語を選ぶことで、応答の多様性を制御する手法。
- プロンプト: 生成AIに指示や質問を与えるためのテキスト入力のこと。
- プロンプトエンジニアリング: 生成AIから目的の出力を引き出すために、効果的なプロンプトを作成・最適化する技術や手法のこと。
プロンプティングの基礎
- Zero-Shot プロンプティング:
モデルに具体的な例をほとんど、あるいは全く与えずに、タスクの指示だけで出力を求めるプロンプティング手法です。モデルが既にもっている知識や推論能力に依存します。
- Few-Shot プロンプティング:
プロンプトの中に、目的のタスクの例をいくつか含めることで、モデルがその例から学習し、より正確な出力を生成するように促す手法です。Zero-Shotよりも精度の高い結果が期待できます。
- Instruction、Context、Input Data、Output Indicator:
効果的なプロンプトを構成する要素として、一般的にこれらが挙げられます。- Instruction (指示): AIに何をさせたいかを明確に伝える部分(例:「要約してください」「箇条書きにしてください」)。
- Context (背景情報): AIがタスクを理解するために必要な追加情報や背景(例:「あなたはマーケティング担当者です」)。
- Input Data (入力データ): AIが処理すべき具体的なデータ(例:要約対象の文章)。
- Output Indicator (出力指示): どのような形式で出力してほしいかを指定する部分(例:「結果を3つの箇条書きで」)。
LLMプロンプティングの実践
- 文章の校正:
誤字脱字の修正、文法のチェック、表現の改善など、文章をより正確で読みやすくするためにAIを利用します。
- 校正箇所の確認:
AIに校正を依頼した際、単に修正させるだけでなく、どこをどのように修正したのかを具体的に説明させることで、自身の学習にもつながります。
- 文章の整理:
冗長な表現を削り、論理的な流れを整えるなど、文章を簡潔かつ明瞭にするためにAIを活用します。
- 文章の要約:
長い文章や記事の主要なポイントを抽出し、短くまとめることができます。
- 箇条書きを文章に変換:
箇条書きで書かれた情報を、自然な文章に展開させる。
- 文章を箇条書きに変換:
長い文章から、要点を箇条書きで抽出させる。
- 文章の対象を変更する:
例えば、ビジネス文書を友人向けのカジュアルなトーンに、あるいはその逆のように、文章のターゲット層やトーンを変更します。
- 話者の設定を変更する:
AIに特定の役割(例:専門家、初心者)を演じさせ、その立場からの回答を生成させます。
- 文章を会話のやり取りへ変換:
一般的な説明文を、質疑応答形式や会話形式に変換して、より分かりやすく表現します。
- 例え話で理解を深める:
複雑な概念を、AIに身近な例え話で説明させることで、理解を助けます。
- 数字の変換:
金額の漢字表記を数字に変換したり、単位を変換したりするなど、数字に関する処理を行います。
- メールの作成:
ビジネスメール、お礼メール、問い合わせメールなど、様々な目的のメール文章を作成します。
- アンケート項目の作成:
特定のテーマに基づいたアンケートの質問項目を考案させます。
- アンケートの分析:
アンケート結果のテキストデータ(自由記述など)から、傾向や意見を抽出・分析します。
- キャッチコピーの作成:
商品やサービスの魅力を伝える短く印象的なフレーズを考案させます。
- ビジネス書類のテンプレート作成:
企画書、報告書、議事録などのビジネス文書の基本的なテンプレートを生成させます。
- アジェンダの作成:
会議やイベントの議題、時間配分、担当者などをまとめたアジェンダを生成させます。
- 業務の手順を分解:
複雑な業務プロセスを、AIに依頼してステップごとに細かく分解させ、理解を助けます。
テキスト生成AIを用いたビジネス応用
- タスクの抽出:
長文のメールや会議の議事録から、実施すべきタスクや決定事項を自動的に抽出します。
- 外国語の翻訳:
多言語対応が必要な業務において、高精度な翻訳ツールとして活用します。
- 英単語から英文の作成:
いくつかのキーワードやコンセプトから、自然な英文を生成し、ビジネスコミュニケーションを円滑にします。
- 海外企業宛のメール文章の作成:
国際的なビジネスにおいて、文化的なニュアンスも考慮したメール文面を効率的に作成します。
- ディベートを行う:
特定のテーマについて、AIに賛成・反対の立場を取らせて議論させることで、多角的な視点を得たり、思考力を鍛えたりします。
- 姓と名の分離:
顧客データなどで氏名が一つのフィールドにまとまっている場合、AIを使って姓と名を正確に分離する作業を行います。
- ふりがなの記載:
氏名や専門用語に自動でふりがな(読み仮名)を振ることで、データの扱いやすさや情報共有の正確性を高めます。
- ブレインストーミング:
新しいアイデアや解決策を出す際に、AIをブレインストーミングの相手として活用し、多様な視点からの発想を得ます。
- 質問させながら一緒に進める:
AIに質問を促させながらプロジェクトやタスクを進めることで、論点を整理したり、見落としを防いだりします。
- 正確な文字数の指定:
SNS投稿や広告文など、文字数制限がある場合に、AIに正確な文字数で文章を生成させることができます。
テキスト生成AIの不得意なこと
- 計算:
大規模言語モデルは、テキストのパターン認識に基づいて動作するため、複雑な数学的計算や正確な数値計算は苦手です。電卓のように正確な計算はできません。
- 最新の情報:
学習データの時点以降に発生した出来事や、リアルタイムの情報については知りません。学習データが古い場合、誤った情報や古い情報を提供する可能性があります。
- 芸術の批評:
人間の感情や主観的な感覚、文化的な背景に深く根ざした芸術作品の真の価値や意味を理解し、批評することはできません。あくまでパターンに基づいた形式的な分析に留まります。
※本記事は、公開されているシラバスをもとに生成AI(Gemini)を使ってキーワードと解説を作成したものです。解説文の長さ等の調整は人間が指示しています。
したがって他から転載したりはしていません。もし著作権等の問題があるようでしたらお知らせください。
同じテーマ「生成AI活用研究」の記事
AIが問う出版の未来は淘汰か進化か:AIと書籍の共存の道とは
AI時代におけるITエンジニアの資質
AI時代の「Hello World」のすすめ:すべてはこの一歩から
AI擬人化の光と影:その心理と健全な付き合い方
AIと『対話』する時代に問う:あなたの前には誰がいますか?
生成AIが拓く「もう一人の自分」とパーソナライゼーションの未来
生成AIパスポート試験 キーワード解説
生成AIパスポート試験 練習問題(四股択一式)
Googleカレンダーの日本の祝日をGASとExcelで取得する ~APIキー不要、XML連携ガイド~
AI×ひらめき ― 「ネタ」が飛躍する創造の増幅プロセス
Googleカレンダーの日本の祝日をGASとExcelで取得する ~APIキー不要、XML連携ガイド~
新着記事NEW ・・・新着記事一覧を見る
Excel×スプレッドシート連携:HTTP GETで学ぶGAS API設計入門|生成AI活用研究(2025-06-04)
AI×ひらめき ― 「ネタ」が飛躍する創造の増幅プロセス|生成AI活用研究(2025-06-03)
Googleカレンダーの日本の祝日をGASとExcelで取得する ~APIキー不要、XML連携ガイド~|生成AI活用研究(2025-06-02)
究極のVBA転記プロンプト公開!あなたの事務作業を劇的に効率化|生成AI活用研究(2025-06-02)
エクセル入門 4択クイズ|エクセル入門(2025-05-31)
VBA入門 4択クイズ|VBA入門(2025-05-30)
Google Calendar iCal形式で祝日取得|Excelリファレンス(2025-05-30)
生成AIが拓く「もう一人の自分」とパーソナライゼーションの未来|生成AI活用研究(2025-05-30)
生成AIパスポート試験 練習問題(四股択一式)|生成AI活用研究(2025-05-29)
生成AIパスポート試験 キーワード解説|生成AI活用研究(2025-05-29)
アクセスランキング ・・・ ランキング一覧を見る
1.最終行の取得(End,Rows.Count)|VBA入門
2.変数宣言のDimとデータ型|VBA入門
3.繰り返し処理(For Next)|VBA入門
4.セルのコピー&値の貼り付け(PasteSpecial)|VBA入門
5.RangeとCellsの使い方|VBA入門
6.FILTER関数(範囲をフィルター処理)|エクセル入門
7.メッセージボックス(MsgBox関数)|VBA入門
8.セルのクリア(Clear,ClearContents)|VBA入門
9.ブックを閉じる・保存(Close,Save,SaveAs)|VBA入門
10.マクロとは?VBAとは?VBAでできること|VBA入門
このサイトがお役に立ちましたら「シェア」「Bookmark」をお願いいたします。
記述には細心の注意をしたつもりですが、
間違いやご指摘がありましたら、「お問い合わせ」からお知らせいただけると幸いです。
掲載のVBAコードは動作を保証するものではなく、あくまでVBA学習のサンプルとして掲載しています。
掲載のVBAコードは自己責任でご使用ください。万一データ破損等の損害が発生しても責任は負いません。