もっと詳しく

ウィキペディアは自由な知識のユニークな泉ですが、世界で最も人気のある百科事典です 常に正確であるとは限りません

サイトのクラウドソーシングされた編集モデルは、破壊行為や偏見に陥りがちです。 正確さで定評がありますが 改善されました、ウィキペディアでさえ 自分自身を考慮していません 信頼できる情報源。

ウィキペディアを監督する非営利団体であるウィキメディア財団は、定期的に これらの欠点の新しいソリューションを探る。 その最新の取り組みは、AIの力を利用しています。

ご挨拶、ヒューマノイド

今すぐニュースレターを購読して、受信トレイにあるお気に入りのAIストーリーを毎週まとめてください。

財団は最近、ウィキペディアの引用を改善するためにメタと提携しました。 これらの参照は、サイト上のクラウドソーシングされた情報を裏付けるために使用されますが、欠落している、不完全である、または不正確であることがよくあります。

ウィキペディアのボランティアは脚注を再確認しますが、それ以上の場合、彼らが追いつくのは困難です。 毎月17,000件の新しい記事が追加されます。 このスケールは、問題を機械学習の魅力的なユースケースにします。

Metaの提案は参照をファクトチェックします。 チームは、それが正確さをチェックするために一度に数十万の引用を自動的にスキャンすることができる最初のモデルであると言います。

ソースコード

モデルのナレッジソースは、1億3400万の公開Webページの新しいデータセットです。 吹き替え球、メタは言います オープンソースライブラリ そのような研究にこれまで使用されたどのコーパスよりも大きく、より複雑です。

私たちの仕事は、ファクトチェックの取り組みを支援することができます。

データセット内の適切なソースを見つけるために、研究者は400万件のウィキペディアの引用でアルゴリズムをトレーニングしました。 これにより、システムは各ステートメントを検証するための単一のソースを発掘することができました。

エビデンスランキングモデルは、代替ソースを元の参照と比較します。

引用が無関係であると思われる場合、システムは、主張を裏付ける特定の箇所とともに、より良い情報源を推奨します。 その後、人間の編集者が提案を確認して承認できます。

これがどのように機能するかを説明するために、研究者は 引退したボクサージョーヒップのウィキペディアのページ。

エントリは、 ブラックフィート族 メンバーとして WBAのために競争する最初のネイティブアメリカン 世界ヘビー級王座。 しかし、モデルは、この主張の引用がHippやボクシングについてさえ言及していないウェブページであることを発見しました。

次に、システムはSphereコーパスで置換リファレンスを検索しました。 この一節を 2015年の記事 グレートフォールズトリビューン

1989年に彼のキャリアの黄昏時に、 [Marvin] キャメルはブラックフィート・ネイションのジョー・ヒップと戦った。 世界ヘビー級王座に挑戦した最初のネイティブアメリカンになったHippは、戦いは彼のキャリアの中で最も奇妙なものの1つであると述べました。

パッセージはボクシングについて明示的に言及していませんが、モデルは手がかりからコンテキストを推測しました。 これらには、元のウィキペディアのエントリで取り上げられた「競争」の同義語としての「ヘビー級」という用語と「チャレンジ」という単語が含まれていました。


将来のファクトチェック

チームは現在、彼らの研究を包括的なシステムに変えることを目指しています。 やがて、彼らはウィキペディアの編集者が引用の問題を体系的に見つけて解決するために使用できるプラットフォームを作成することを計画しています。

メタも持っています プロジェクトをオープンソース化、外部の研究者に独自のAI言語システムを開発するための新しいツールを提供する可能性があります。

「私たちの結果は、AIベースのシステムを人間と連携して使用して、ウィキペディアの検証可能性を向上させることができることを示しています。」 研究の著者は書いた

「より一般的には、私たちの仕事が事実確認の取り組みを支援し、オンラインでの情報の一般的な信頼性を高めるために使用できることを願っています。」

調査はさらに、自動化されたファクトチェックとビッグテック企業が真実の仲裁者になることを恐れているかもしれません。 より楽観的な見方は、メタがついにその使用方法を見つけたということです 誤報の経験 永久に。

The post ウィキペディアは誤った情報と戦う驚くべき同盟国になります:メタ appeared first on Gamingsym Japan.