V2EX - tool3d

[程序员] 感觉一些人对 claude 3.7 sonnet 有误解，以为是编程领域最强的模型。

2025-03-17T04:37:40Z

其实只是“某种意义”上的最强。编程分两种，一种是 CURD 工程化，也就是 claude 3.7 sonnet 擅长的领域，用朴实无华的编程技能，把整个页面写完善，出成品，这是 claude 3.7 的强项。

另一种编程领域，是竞赛制编程，和数学推理能力很接近，在这一点上 o3-mini-high 要明显强过 claude 3.7 ，所以 claude 3.7 编程专项领域的跑分，看起来并不算太亮眼。

下图是最新的编程竞赛跑分，3.7 连 deepseek r1 都没能打过，实在很遗憾。但是论项目开发，claude 3.7 舍我其谁！

[程序员] google 的新模型，智能文字修图，效果实在是很炸裂。

2025-03-14T17:48:44Z

我就用了一个提示词，"把图片中的猫咪修改成柴犬"。

能达到这种效果，是我完全没想到的。

目前 API 这个功能已经上线，免费，并且可以直接命令行来使用！ google 真是大善人。

但是我想吐糟一句，google 把所有图片都转成了 base64 ，导致 api json 请求返回巨大。而且很不好写流式图片的加载代码（服务器返回的是 png ，如果是 jpg ，还能边解压边显示）。

[Local LLM] 半个小时前， ollama 上线了目前单显卡里，最强的中小模型 gemma3

2025-03-12T09:28:04Z

由 google 出品，ollama 介绍就一句话“The current strongest model that fits on a single GPU.”，足以证明其强悍程度。

我去 google ai 官方页面看了跑分，27b 的小体积，竟然把体积大自己 20 倍的 deepseek v3 满血模型给灭了？有点令人难以置信。

官方介绍在这里，我也不知道真假，让子弹多飞一会儿。

https://ai.google.dev/gemma