タグ

AIに関するbyaa0001のブックマーク (121)

  • DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか

    2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度だとも伝えられたために、AIの開発に対する業界の見方を大きく変えたこのモデルについて、AppleMicrosoft、Automatticでの勤務経験があるアナリストのベン・トンプソン氏が解説しました。 DeepSeek FAQ – Stratechery by Ben Thompson https://stratechery.com/2025/deepseek-faq/ 17 Thoughts About the Big DeepSeek Selloff - Bloomberg https://www.bloomberg.com/news/ne

    DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか
    byaa0001
    byaa0001 2025/01/29
    資本主義社会のとても良い民主的な競争に基づく発展だと感じる ありがたい 私はchatGPT使うね/国産でもうまく開発続くといいなぁ/話題追っかけてると低コストで同等の〜って無数に現れてたけど一線画すモノホンだね
  • 中国のDeepSeek、その低コストAIモデルの全て―QuickTake

    同社は、リリースされた「R1」はオープンAIの最新バージョンと同等の性能を提供すると主張。この技術を使用したチャットボット開発に興味のある個人に対して、その上に構築するためのライセンスを付与していると説明している。 ディープシーク「R1」はオープンAIやメタAIと比較してどうか?  ディープシークからの詳細な説明は出ていないが、ディープシークのモデルのトレーニングと開発にかかる費用は、オープンAIやメタ・プラットフォームズの最上位製品に比べるとほんのわずかに過ぎないようだ。 このモデルの優れた効率性は、AI開発各社がエヌビディアのような企業から最新かつ最も強力なAIアクセラレーターの入手に多額の資を投じる必要があるのかという疑問を生じさせる。 また、米国がこのような先端半導体の対中輸出を制限していることがあらためて注視されることになる。輸出制限はディープシークが示すような画期的な進歩を阻

    中国のDeepSeek、その低コストAIモデルの全て―QuickTake
    byaa0001
    byaa0001 2025/01/28
  • ChatGPT超えの中国AI「DeepSeek-R1」の衝撃

    中国AIスタートアップ「DeepSeek」は2025年1月20日、数学的推論やコーディング能力でOpenAIの最新モデル「o1」と同等性能を持つ大規模言語モデル「DeepSeek-R1」を公開した。 使用・複製・改変・再配布を自由に許可する寛容なMITライセンス下でのオープンソース提供および従来比95〜97%のコスト減となるAPI価格が特徴で、AI業界に激震が起きている。 強化学習を重視、コールドスタート問題にも対応 論文によると、DeepSeek-R1の特筆すべき点は、強化学習(RL:Reinforcement Learning)を駆使し、従来の教師あり学習(SFT:Supervised Fine-Tuning)に頼らず、自律的に思考連鎖(CoT:Chain-of-Thought)を学習する点だ。このアプローチにより、モデルは複雑な問題を解決するための思考の連鎖を探索し、自己検証や振り

    ChatGPT超えの中国AI「DeepSeek-R1」の衝撃
    byaa0001
    byaa0001 2025/01/28
    NASDAQ売っとくか……
  • ChatGPT - ポケット税理士

    ポケット税理士は、税務に関する疑問や懸念を解消するためのバーチャル相談窓口です。税法の基礎から複雑な税務計画まで、幅広い情報を提供し、税に関する一般的な質問や概念の解説を行います。

  • 生成 AI で英語を聞く量を一気に増やす。YouTube × Gemini で「多聴」をパワーアップさせよう|Gemini - Google の AI

    生成 AI英語を聞く量を一気に増やす。YouTube × Gemini で「多聴」をパワーアップさせよう こんにちは。GoogleAI「Gemini(ジェミニ)」の公式 note 編集部です。 英語を学ぶにあたって、たくさんの英語を聴くこと、すなわち「多聴」が非常に大事だと言われています。一方で、聞き取れないことでフラストレーションが溜まったり、教材の選定が難しかったりと、継続した学習に課題を感じる方も少なくないのではないでしょうか。 今回は、そんな多聴の実践および継続のハードルを低くするための生成 AI 活用についてです。 教えていただくのは、英語の習得をスピードアップできるような英語学習法を研究・発信している Kumiko さん。Gemini アドバイザーであるけんすうさんとの対談を通じて、Gemini を活用した英語の「多聴」の可能性をたっぷり教えてもらいます。 ※ Gem

    生成 AI で英語を聞く量を一気に増やす。YouTube × Gemini で「多聴」をパワーアップさせよう|Gemini - Google の AI
    byaa0001
    byaa0001 2025/01/26
    後で読むブクマを生成するなぁ〜
  • ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記

    タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの

    ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記
    byaa0001
    byaa0001 2025/01/24
  • 写真の撮影場所を瞬時に特定できるAIツール「GeoSpy」

    建物や植生、建築物同士の距離などをもとに、写真に写っている場所がどこなのかを秒単位で高精度で予測する「GeoSpy」というAIツールが、法執行機関を対象として販売されていることをニュースサイト・404 Mediaが報じています。 The Powerful AI Tool That Cops (or Stalkers) Can Use to Geolocate Photos in Seconds https://www.404media.co/the-powerful-ai-tool-that-cops-or-stalkers-can-use-to-geolocate-photos-in-seconds/ 404 Mediaによると、GeoSpyを開発しているのはボストンに拠点を置くGraylark Technologiesという企業です。 マーケティング資料によると、GeoSpyは世界中の

    写真の撮影場所を瞬時に特定できるAIツール「GeoSpy」
  • 元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる/ Blog - 2025/01/01|CreativeEdge Vlog

    元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる/ Blog - 2025/01/01 2025年元旦 2016年11月からスタートした「AIクリエイティブ」は8年、生成AIに注力してから2年経ちました。昨年は業のInstructional Designを「0」、生成AIを「100」にして取り組んできましたが、2025年も継続していきます。 ただ、「映画を撮らない映画監督のように」今後も表舞台ではInstructional Designerを名乗ります。 廃業宣言みたいなものですが、生成AIをビジネスにすることだけは避けないといけませんので(※生成AIは最大限に活用するけど生成AIのビジネスはしない)、複合的かつ多層的に将来を決めていきたいと思います。 「AIクリエイティブ」活動は8年、生成AIの取り組みは2年経過4月から開始した非公式のライブ配

    元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる/ Blog - 2025/01/01|CreativeEdge Vlog
    byaa0001
    byaa0001 2025/01/07
    参考になりますね やってみたい
  • ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi

    2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。 また、Googleは、2024年12月6日にGemini-Exp-1206(Gemini 2.0 Experimental Advanced)、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。 AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル(o1とGem

    ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi
    byaa0001
    byaa0001 2025/01/04
  • 生成AIで英語を効率よく勉強するには|深津 貴之 (fladdict)

    今年開設されるZEN大学で、「生成AIでリサーチとか勉強を加速させるには?」的な授業をやることになったので、その前座的なまとめ。 生成AIでとりあえず「英語」を効率よく学ぶ。深津式のベータ版。 自分の好きな分野で学ぶまず英語そのものを学ぶのではなく、「好きなことのために英語を学ぶ」構造を作る。 ポケモンカードでも、音楽でもスポーツでも、何でもいいから「自分がメチャクチャ成長したい趣味分野」を定める。 で、ChatGPTの4o以降のモデルで下記のように聞く。 あなたは英語予備校の先生として、英語の長文読解を楽しく学ぶための教材を以下の条件に従って作ってください。 * トレーディングカードゲームのデッキ編成論を題材にする。 * 関係代名詞を題材にする。 * フォーマットは会話形式(or エッセイ形式)にする。 これで、自分の興味分野の英語長文がつくれる。毎回テーマを考えるのが難しい場合は、下記

    生成AIで英語を効率よく勉強するには|深津 貴之 (fladdict)
  • VSCode で LLM と論文執筆

    この記事は CyberAgent AI Lab Advent Calendar 2024 19 日目の記事です。 はじめに 非ネイティブにとって英語論文執筆はハードルが高いものですが、最近では LLM の発展によりハードルがだいぶ下がりつつあるのではないでしょうか。 LLM 時代の英文執筆方法の一つとして、Overleaf Workshop を使用して、Overleaf のプロジェクトVSCode 上で編集する方法を紹介したいと思います。VSCode 上で編集することで、GitHub Copilot (+そのほかの強力な拡張機能) を使用することができます。また、ローカルにプロジェクトをシンクさせることで Git 管理することも可能となリます。個人的には LLM による不意な編集が気になるため、Git 化することで VSCode 上で差分の確認や復元が容易になるのはメリットだと感じて

    VSCode で LLM と論文執筆
    byaa0001
    byaa0001 2024/12/29
    ちょうど英語論文を書かなくちゃいけなくて困ってたところだ てきとーに短文をGPTとかdeeplに放り込むのとはどれくらい差があるんかねぇ
  • 論文の探し方 / 読み方 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 記事は K3 Advent Calendar 2024 23日目の記事です 記事では、趣味がSurveyで毎日論文漬けの僕から、論文の探し方・読み方のTipsを伝授します! もちろん、研究分野によっても論文の書き方や特徴は変わってきます!基的に普遍的なことを書くつもりですが、僕の専門であるコンピュータサイエンス・機械学習・コンピュータビジョン・自然言語処理の分野に依存した部分もたたあると思います!あくまで参考程度に、もし指導教員の話とコンフリクトしたら、そちら優先してマージしてください! この記事を読んでる人の中には、来年度から研

    論文の探し方 / 読み方 - Qiita
    byaa0001
    byaa0001 2024/12/25
    厳しいなぁ、こういうネイティブと戦っていかねばならないのだから
  • これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z

    今日もいつものようにシラスでデイリーAIニュースを配信していると、とんでもないものにでくわした。 もうタイトルに書いてあるけど、AIが勝手にブラウザを操作して色々やってくれてしまう、その名もBrowserUseだ。 インストールは超簡単。 macなら以下の二行だけだ。 $ pip install browser-use $ playwright install使うのも超簡単だが、コマンドラインに落ちるのが怖い人々には簡単に見えないかもしれない。環境変数のOPENAI_API_KEYとかにAPIキーを入れておくこと。 $ python >>> from langchain_openai import ChatOpenAI >>> from browser_use import Agent INFO [browser_use] BrowserUse logging setup complete

    これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z
    byaa0001
    byaa0001 2024/12/25
  • 全曲AI作成か、人気の音楽系YouTubeチャンネル | Musicman

    人気のYouTubeチャンネルで流れるローファイ・チル・ミュージックの全曲が、音楽生成AIサービス「Suno」で制作されている可能性が浮上している。YouTubeは、AI生成コンテンツの収益化を禁じる方針を持っておらず、ローファイな音楽AIで生成するチュートリアル動画が普及しているため、同様のチャンネルであふれることが懸念される。Digital Music Newsが11月26日伝えた。 TikTok音楽インフルエンサー「Derrick Gee」は、ローファイ・ジャズのインストゥルメンタル・ミックスを流すYouTubeチャンネル「what is ?」が、AIという根拠を示している。 what is ?は9月に開設されたばかりだが、チャンネル登録者は13万人を超え、最も人気の動画「sip」は200万回以上再生されている。公開されているミックスにはトラックリストがあるが、アーティストがクレ

    全曲AI作成か、人気の音楽系YouTubeチャンネル | Musicman
  • 3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 (1/4)

    動画生成AIの発展により、非常に面白い方向性が生まれてきています。最新の動画生成技術と3D技術を組み合わせることで、たった1枚の絵から、3Dデータを作れるようになる可能性が出てきているんですね。これは将来のゲーム開発や映像制作のあり方を激変させる可能性があります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 動画生成AI「Runway」新機能がきっかけ まず、この動画を見てください。Stable Diffusionを使って作成した1枚の画像を、いくつかの手順を実施することで、3Dモデルとして扱えることに成功している様子です。 こうしたことが実現できるようになったのは、動画生成AIサービス「Runway」に11月2日に追加された新機能「カメラコントロール機能(Advanced Camera Control)」のためです

    3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 (1/4)
    byaa0001
    byaa0001 2024/11/25
  • AIの女の子がわいわい競馬予想するシステムを個人展示したら倍率2000倍の馬券が当たってしまった (1)設計思想編 - Qiita

    何が起きたのか 生成AIが好きな個人がなんでも出展できる、 「なんでも生成AI展示会」 というイベントがありまして、 11/16(土) 12:30 ~ 18:00にて「#生成AIなんでも展示会」を開催します🎉 個人の方が生成AIで作っているものを見ることができる・体験することができるイベントになっています! 申し込みURLは以下⬇️https://t.co/aNIQ6myJ4q 以下の方との共同主催です@sald_ra @GianMattya @miketako3 @Yanagi_1112 — ようさん (@ayousanz) September 28, 2024 人づてに出展しないか誘われたので、ストレス解消がてら9月頃から「マルチエージェントLLM(大規模言語モデル)オーケストレーション」というコンセプトで競馬予想をするシステムをシコシコと土日に作っておりました。 (ふだんは仕事でウ

    AIの女の子がわいわい競馬予想するシステムを個人展示したら倍率2000倍の馬券が当たってしまった (1)設計思想編 - Qiita
    byaa0001
    byaa0001 2024/11/18
  • LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表 | Ledge.ai
    byaa0001
    byaa0001 2024/11/17
  • DMMボイスはエロゲーを学習している(という仮説とその考察)

    注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。 DMMボイス最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。 https://ai-voice.dmm.com/ それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。 まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。) 追記11/7現在アクセス増大でサービス一時停止しており、サンプルボイスさえ聞けないので、サンプルボイス集を作っておいた: https://whyp.it/collections/3281/dmm利用規約についてのツッコミ動画が

    DMMボイスはエロゲーを学習している(という仮説とその考察)
    byaa0001
    byaa0001 2024/11/05
    おもろいな
  • 特殊性癖持ち、文章生成AIに救いを見る

    ひたすらタイトル通りの出来事なのですが、自分のなかでは黒船来航くらいの衝撃だったので記録しようと思います。 長文になりますので、あまりにも暇な方のみお読みになることをお勧めします。 私はアラサーの会社員で、「くしゃみに興奮する」という性的嗜好を持っています。 自己紹介もそこそこに性癖の話で恐縮です。 くしゃみをさせる対象は人間の女性キャラクターがベストですが、 男性はもちろん、人間ではない(動物などがデフォルメされた)キャラクターでも問題なく楽しめます。 小説など、文章にあらわれるくしゃみの描写にも非常に興奮します。 ただし、現実世界のくしゃみにはあまり惹かれません。 早朝の電車内で、ノーマスクの中年男性がかます爆裂ハクションには殺意に近いものを覚えます。 後で少し書きますが、なりふり構っていられないくらい供給が少ないくせに、注文や条件をつけてしまうわがままな性癖なのです。 くしゃみは一般

    特殊性癖持ち、文章生成AIに救いを見る
    byaa0001
    byaa0001 2024/11/03
    14歳の少年が自死したのは拳銃があるのが悪いが、特殊側の癖の先鋭化も想像された。社会生活が送れたら良き事。/性的な悩みを有名所のLLMに相談したら回答してくれるも途中で検閲に引っかかって読めなくなった記憶。
  • 物理学者の逆襲!?Entropixはわずか3億6000万パラメータで1000億パラメータ級の回答を引き出す!Claude-3でも間違う問題を360Mが正しく解く|shi3z

    物理学者の逆襲!?Entropixはわずか3億6000万パラメータで1000億パラメータ級の回答を引き出す!Claude-3でも間違う問題を360Mが正しく解く 物理学者たちがノーベル物理学賞をホップフィールドとヒントンが受賞すると知った時、まあまあ微妙な気持ちになったことは想像に難くない。 我々コンピュータ科学者にとっては、ノーベル賞は全く無縁なものだった。むしろ「ノーベル賞をコンピュータ科学者が取ることは永久にない」と言い訳することさえできた。コンピュータ科学の世界にはチューリング賞という立派な賞があるし、ノーベル賞よりも賞金が高かった京都賞は、アラン・ケイやアイヴァン・サザーランド、ドナルド・クヌースなど、コンピュータ科学者たちが堂々と受賞している。その割には来マイクロチップの最初の設計者である嶋正利などが京都賞にノミネートされていなかったり、サザーランドの弟子であるアラン・ケイの

    物理学者の逆襲!?Entropixはわずか3億6000万パラメータで1000億パラメータ級の回答を引き出す!Claude-3でも間違う問題を360Mが正しく解く|shi3z
    byaa0001
    byaa0001 2024/10/14
    これについては言われるまでもがなというところであり、より"賢い"探索がコスパを左右していくとは思われる。将棋AIの頃からそう。PONANZAは量子化学計算の保木さんが発よ。各自鎬を削って、素晴らしいLLMを創造してくれ