2024-11-17

anond:20241117125020

優しくない増田ばかりなので、なんで意味がないと言われるか説明するね

基本的に、学習前には集めたデータフィルタリングを行うので、ゴミそもそも除外されることが多いんだ

分類条件は、画像サイズだったり、画像説明文の一致度だったり、色々ある

そうして何度かろ過されたものが、学習に使われるデータセットになるんだよ

なので、せいぜい画像ダウンロードフィルタリング時間を一瞬伸ばせるくらいの効果しか見込めない

ただAI検索のような、生成時に検索を行うAIが、正しい回答を出力する邪魔はできる

これの難点は、人間にとってもノイズになるという事だね

AI画像や人力デマ検索上位に出てくると困るように、AI邪魔になるということは、人間邪魔にもなるんだ

ところで画像生成モデルは、色んな画像の色んな特徴を学習して、その学習結果を元に生成するんだよね

まりゴミゴミとして学習できていると、ゴミから適切に距離を取ることも可能になるんだ

からゴミ画像ばかり集めて、ゴミから距離を取るために使うモデルというものもあるよ

例えば僕達は、進行ルート上にウンコが落ちてたら、避けるでしょ?

それは、僕達がウンコという物質学習していて、できれば踏みたくない、忌避すべきものだと思っているか

これは生成AI的に言うと、negative prompt: poop が与えられている状態と同じなんだ

でも、ウンコ研究家なら近寄って採取することもあるよね

なので、場合によっては有益データとして見ることも可能ですらあるの

というわけで、「全く効果がない」は単純化しすぎだけど、人間にも迷惑だし、基本的には無益行為と言える

「たとえ自分時間その他コストを支払ってでも、気に食わないアイツが損するならそれでいい!」という思考の人以外にはおすすめできないか

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん