LLMの権威主義
市販の生成AIが学習データとして用いる情報は、正確な情報というより権威のある情報である。例えばソーシャルメディア上の情報より新聞社やテレビ局といったオールドメディアの情報が重視されている。
日本では記者クラブ制度の存在によってオールドメディアが発信する情報は歪められているため、ソーシャルメディア上の情報の方が精度が高いという逆転現象がしばしば起きる。
これは生成AIの出力にも影響し、偏った情報が生成AIを通してこれまでより強力に拡散される恐れがある。一方で、オールドメディアの情報が偏っているということを知っている人にとっては生成AIより正確な判断ができるわけだから、その強みを活かしてAIで代替することが難しいビジネスを展開できる。
ネットワーク効果
コモディティ化しやすい。この欠点を補うためには、ネットワーク効果を活かせる事業を先行して展開して高いシェアを取り、ネットワーク効果を活かして参入障壁を作ることである。その点ではAmazonやGoogleなどのプラットフォーマーがAIの開発に莫大な投資をするのは合理的だ。
情報の正確性の検証
背景
- メディアの信頼性は、これまでメディアの存続期間や読者数に基づいて評価されてきた。しかし個人が情報発信できるようになり、報道機関がフェイクニュースを流すようになってきているため信頼性評価指標を刷新する必要がある。
- 「汚染水というミスリーディングな表現を用いた回数の集計」といった単純な処理はこれまで行われてきたが、記事の文脈の理解が必要な処理は負荷が大きいため行われてこなかった。
- AIの学習データとしてオールドメディアの情報を特権的に使わせ、世論操作する可能性がある。
責任の重さの推定
- メディアが自身の立ち位置をどう定義しているか
- 中立公正を標榜しているならば、それに反する報道は他のメディアよりも罪は重い。
- 読者がメディアをどう捉えているか
- メディアが中立公正を標榜していても、読者が中立公正だと信じていないのであれば大きな問題ではない。
- メディアの社会的影響力
- 特権的地位にあるか
- クロスオーナーシップや記者クラブによって特権的地位を持つならば、尚更の中立公正の義務が求められる。
ビジネスへの応用
- 文章から誤謬・詭弁の手法を特定、分類
- 発信元不明の情報の発信元の推定
- メディアの歴史や組織構造、ステークホルダーの情報も組み合わせて、情報発信の意図を解析する。
- 報道や論文、プレスリリースなどにおいて公平な表現を提案
- イデオロギーを数値化・グラフ化すると注目を浴びやすい
- ウェブ上の情報を収集し、個人や組織に不利益があるような情報があれば通知する
- LLMの事前学習の際に、悪意ある情報や情報源を、採用するデータセットから除外できる
技術仕様
- 発信内容の公平性を評価するには、テーマを特定して、そのテーマに関する情報を収集する必要がある
- ジャーナリストではない個人が発信する情報で報道機関の報道が覆されることがあるので、個人が発信する情報の真正性を評価するシステムが必要。
持続的な競争優位性があるか
詭弁を駆使した偏向報道は日本特有の現象であるので、LLM開発企業が米中に集中していることを考えると、ビジネスモデルを奪われるおそれは少ない。