タグ

AIとLLMに関するbyaa0001のブックマーク (5)

  • 音声入力+生成AI試してみた

    この数日でバズっていた一連の記事を読んで自分も試してみることにした。 【発端】音声入力とAIの組み合わせが強力だという骨しゃぶり氏の記事 https://honeshabri.hatenablog.com/entry/talk2ai 【音声入力】SuperWhisperが良いよというお話 https://umiyosh.hatenablog.com/entry/2025/02/26/215102 【テキストエディター】Cursorはコード書くだけじゃなく、AIを使った文章作成にもいいよというお話 https://ascii.jp/elem/000/004/253/4253872/ 結論から言うと骨しゃぶり氏の言ってることがよくわかった。めっちゃ便利というかちょっとしたイノベーション感じてる。 音声入力自体は以前にも試したことあるけど、そこから先が人力編集なのと、間にAIをかますのとではまっ

    音声入力+生成AI試してみた
    byaa0001
    byaa0001 2025/03/01
    後で試す…あとで…やれよ自分……
  • ゼロから始めるAITuberの作り方|ニケちゃん

    こんにちは、ニケです。 皆さん、AITuber 開発していますでしょうか? AITuber、最近よく聞く言葉ですね。 面白そうだけどどこから始めればよいか分からない、という方も多いと思います。 というわけで今回は、AITuberという分野に興味を持っている方のために、できるだけ簡単にAITuberの作り方について解説していこうと思います。 具体的に「Youtubeのライブチャットに反応してキャラクターが応答を返すAITuber」を作成します。 下記が完成版のサンプルです。 なお、非エンジニアの方でも理解できるように、今回は仕組みの説明に注力し、コードの中身は解説しません。 動作コードはほぼ1つのファイルに収まっているため、コードに興味がある方は、ChatGPTにそのままコピペして解説してもらうと良いでしょう。コードは後ほど共有します。 ちなみに簡単に自己紹介すると、私は普段 AITuber

    ゼロから始めるAITuberの作り方|ニケちゃん
    byaa0001
    byaa0001 2025/02/25
    対話までしなくても、コメント読み上げ時にアバターがらしいよい反応をあつ森とかくらいのリアクションでやってくれるツールを作ろうと思っている 参考になるかな
  • VSCode で LLM と論文執筆

    この記事は CyberAgent AI Lab Advent Calendar 2024 19 日目の記事です。 はじめに 非ネイティブにとって英語論文執筆はハードルが高いものですが、最近では LLM の発展によりハードルがだいぶ下がりつつあるのではないでしょうか。 LLM 時代の英文執筆方法の一つとして、Overleaf Workshop を使用して、Overleaf のプロジェクトVSCode 上で編集する方法を紹介したいと思います。VSCode 上で編集することで、GitHub Copilot (+そのほかの強力な拡張機能) を使用することができます。また、ローカルにプロジェクトをシンクさせることで Git 管理することも可能となリます。個人的には LLM による不意な編集が気になるため、Git 化することで VSCode 上で差分の確認や復元が容易になるのはメリットだと感じて

    VSCode で LLM と論文執筆
    byaa0001
    byaa0001 2024/12/29
    ちょうど英語論文を書かなくちゃいけなくて困ってたところだ てきとーに短文をGPTとかdeeplに放り込むのとはどれくらい差があるんかねぇ
  • 話題のGraphRAGとは - 内部構造の解析と実用性の考察

    初めまして。経営企画AI推進室の鏡味、窪田、小林と申します。当社は年度、AI推進室という新組織を発足させ、主に生成AIについての社内の利用促進、およびユーザーへ生成AIを活用したソリューションの提供を進めるべく、新技術の展開や検証を行っています。 今回は、最近話題となっている、Microsoftが発表したRAG(Retrieval Augmented Generation)技術であるGraphRAG ⧉について、元となる論文やブログ記事、GitHubのコードを元に内部の構造を解析し、さらに現時点でどの程度実用的かを考察していきます。 GraphRAGとは GraphRAGは、ナレッジグラフと生成AI技術を組み合わせることで、従来のRAGでは対応が難しかった問い合わせに回答できるようになったRAGです。2024年2月にMicrosoftによって発表 ⧉され、その後、2024年7月にリ

    話題のGraphRAGとは - 内部構造の解析と実用性の考察
  • LLM時代の強化学習 - どこから見てもメンダコ

    強化学習におけるLLMの活用パターン調査 はじめに:実世界における強化学習の課題 LLM×強化学習 人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例 さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル 外部知識にもとづく報酬モデル設計 2. 計画モデルとしてのLLM LLMによるセマンティック計画 LLMによる構造的な探索計画 3. 方策モデルとしてのLLM LLM as 確率方策 マルチモーダルLLM as 確率方策 参考:GPTアーキテクチャの転用 4. 世界モデルとしてのLLM Language Models Meet World Models (あとで書く) おわりに:VLM as 確率方策に期待 はじめに:実世界における強化学習の課題 レトロゲームで人間並みのパ

    LLM時代の強化学習 - どこから見てもメンダコ
  • 1