V2EX - tool3d way to explore https://www.v2ex.com/ 2025-03-17T20:53:41Z Copyright © 2010-2018, V2EX [程序员] 感觉一些人对 claude 3.7 sonnet 有误解,以为是编程领域最强的模型。 tag:www.v2ex.com,2025-03-17:/t/1119002 2025-03-17T04:37:40Z 2025-03-17T20:53:41Z tool3d https://www.v2ex.com/member/tool3d
另一种编程领域,是竞赛制编程,和数学推理能力很接近,在这一点上 o3-mini-high 要明显强过 claude 3.7 ,所以 claude 3.7 编程专项领域的跑分,看起来并不算太亮眼。

下图是最新的编程竞赛跑分,3.7 连 deepseek r1 都没能打过,实在很遗憾。但是论项目开发,claude 3.7 舍我其谁!

]]>
[程序员] google 的新模型,智能文字修图,效果实在是很炸裂。 tag:www.v2ex.com,2025-03-14:/t/1118568 2025-03-14T17:48:44Z 2025-03-16T05:30:10Z tool3d https://www.v2ex.com/member/tool3d
能达到这种效果,是我完全没想到的。

目前 API 这个功能已经上线,免费,并且可以直接命令行来使用! google 真是大善人。

但是我想吐糟一句,google 把所有图片都转成了 base64 ,导致 api json 请求返回巨大。而且很不好写流式图片的加载代码(服务器返回的是 png ,如果是 jpg ,还能边解压边显示)。

]]>
[Local LLM] 半个小时前, ollama 上线了目前单显卡里,最强的中小模型 gemma3 tag:www.v2ex.com,2025-03-12:/t/1117922 2025-03-12T09:28:04Z 2025-03-13T08:31:39Z tool3d https://www.v2ex.com/member/tool3d 由 google 出品,ollama 介绍就一句话“The current strongest model that fits on a single GPU.”,足以证明其强悍程度。

我去 google ai 官方页面看了跑分,27b 的小体积,竟然把体积大自己 20 倍的 deepseek v3 满血模型给灭了?有点令人难以置信。

官方介绍在这里,我也不知道真假,让子弹多飞一会儿。

https://ai.google.dev/gemma

]]>