Plan & Act modes represent Cline's approach to structured AI development, emphasizing thoughtful planning before implementation. This dual-mode system helps developers create more maintainable, accurate code while reducing iteration time.
Our Transformers Code Agent beats the GAIA benchmark! By July 1, 2024 • 74 DeepSeek's reasoning skills are probably particularly useful for something like this. But in my mind, particularly for academic research type tasks, the propaganda baked into the model is a non-starter. I tested out the new DeepSeek-R1-Distill-Llama-70B-Uncensored-v2-Unbiased model yesterday. It was a very crude test, but I
「現在の事業はだいたい3000人で運営している。非常にモデスト(謙虚)な目標だが、これを半分にする。半分で現業を成長させながら、残りのもう半分で新規事業をやっていく。DeNAはAIにオールインする」──DeNAの南場智子代表取締役会長は、同社が2月5日に開催したAIイベント「DeNA×AI Day」の基調講演で、今後の事業方針についてこう語った。 南場会長は生成AIによる効率化によって、現業の維持・成長に必要なホワイトカラー人員を削減。浮いた人的リソースで、アプリレイヤーの生成AIサービスを新たに手掛ける方針を示した。 新規事業としては、B2BとB2Cのサービス双方を想定する。B2Bでは、バーティカル(業界特化型)AIエージェントサービスを立ち上げるという。ターゲットとなる業界は、既存事業で知見のあるヘルスケアやスポーツ分野を想定。ただしM&Aによって他分野に進出する可能性もあるとした。
Evaluating Security Risk in DeepSeek and Other Frontier Reasoning Models5 min read Paul Kassianik, Amin Karbasi This original research is the result of close collaboration between AI security researchers from Robust Intelligence, now a part of Cisco, and the University of Pennsylvania including Yaron Singer, Amin Karbasi, Paul Kassianik, Mahdi Sabbaghi, Hamed Hassani, and George Pappas. Executive
筆者自信、個人開発を長い間やってきた&toB含め多くの開発に携わってきました。もともと開発速度に自信があり力でねじ伏せるタイプでしたが、それでもこのCursorを使い始めて世界が変わりました。具体的には、よくあるAI驚き屋の「3分でLPが作れた」「24時間AIが自動で」とかではなく、実践的な開発で6~10倍程度のスピードが出せるようになりました。序盤は10倍どころかとんでもない速度で仕上がっていきます。 筆者はAI駆動開発にハマり、1500時間くらいCursorを使い込んできたので、その経験を踏まえて現状をしっかり解説します。 この記事を読むとわかるCursorの持つ可能性 「コードを書く」から「AIがコードを書き、開発者が補助する」すべての機能 基本はProプラン$20で何でもできる 0→1開発から複雑な大規模プロジェクトまで、Composer Agent がマジでやばい ここ数年でGi
はじめに こんにちは、UbieでQAエンジニアをしている ackey です。 昨年の12月よりアプリチーム全体の開発・運用生産性改善を担うチームに所属しています。 本記事では、AIエージェントを使ったテストコード生成におけるちょっとした工夫事例をご紹介します。 2025年初頭時点での試行錯誤の記録として、また、生成AI時代を生き抜こうともがくQAエンジニアの取り組みとして参考になれば幸いです。 AIエージェントとのやりとりで感じた課題 UbieではCursorやClineなど開発AIエージェントのトライアルを一部のプロジェクトで開始しており、もはやAIエージェントなしの開発スタイルには戻れない状態になりつつあります。 アプリチームでもAIエージェントの利用は活発で、新機能開発からテストコードの生成まで幅広く活用されています。QAエンジニアの私も主にテスト作成文脈[1]でAIエージェントを活
You can run this tool on the entire directory and it would generate a well-formatted Markdown prompt detailing the source tree structure, and all the code. You can then upload this document to either GPT or Claude models with higher context windows and ask it to: Quickly generate LLM prompts from codebases of any size. Customize prompt generation with Handlebars templates. (See the default templat
Autify Genesisは、生成AIを活用してプロダクトの仕様書からテストケース・テストシナリオを自動生成するソリューションです。
Your chats are private and never leave your deviceGPT4All is built with privacy and security first. Use LLMs with your sensitive local data without it ever leaving your device. Run language models on consumer hardwareGPT4All allows you to run LLMs on CPUs and GPUs. It fully supports Mac M Series chips, AMD, and NVIDIA GPUs. Chat with your local filesGrant your local LLM access to your private, sen
Devin.aiを試す 長くなってきたので切り出した Devin.aiを試す2024 2025-01-02 Session Usage Limitについて Devin went to sleep due to session usage limits. Limitをだいぶ超えてから止まるようだw 追記 説明を読むとセッション単位のように読めますが、最後のユーザーの発言以降で使用できる ACUs の上限 (by teramoto) あ、そうなんだ、どうりで超えてるものもあるなぁと思った Devin観察日記 3日目|Daiki Teramoto nishio 「さて、いよいよ金銭感覚が麻痺して参りました。一歩先の未来を生きるためのコストとして受け入れつつも、たまに冷静になる瞬間が恐ろしいです。」 あーあー聞こえないーー(1ヶ月のトークンを1週間で使い切っておかわりした人) nishio 冗談は
LongWriterの概要 これまでの大規模言語モデルは、長文テキスト生成が苦手でした。しかしLongWriterは従来の大規模言語モデルが生成できなかった長文テキストを生成可能なモデルです。 最大10,000ワードのテキストを生成することができ、従来の大規模言語モデルに比べて、非常に高品質なテキストを生成できます。 LongWiterが登場したことにより、高校や大学のレポート課題というものがなくなりそうです。生成速度もかなり速く、3.6万字程度の内容は1-2分で生成。 ローカルLLMでLongWriterを試してみたけどすごいわ。「アトピー性皮膚炎の病態と治療」というテーマだけで、3万字近い原稿を自動で書いてくれた。しかも、内容の質と精度が高い。ちなみにこれ動かしたのはapple M3… pic.twitter.com/Kl1a35YGOt — 大塚篤司【医師’医学博士】Atsushi
Googleは、人間がタスクを与えると自律的に実装計画を立ててコードの生成や変更、バグフィクスなどを実行してくれるAIエージェント「Jules」を発表しました。 同社が発表した最新の生成AIモデルであるGemini 2.0が用いられています。 タスクやイシューを与えると、それを起点に自律的なプログラミングを行う生成AIを用いたサービスは、先日正式サービス化されたDevinや、現在テクニカルプレビュー中のGitHub Copilot Workspaceなど、すでに先行しているサービスが存在します。 参考:GitHub、「Copilot Workspace」テクニカルプレビューを開始。ほとんど全ての開発工程をAIで自動化 GoogleもGemini 2.0によって、同様に自律的なプログラミングが可能なレベルのサービスを開発可能になったということでしょう。 Julesが動作する様子 Google
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く