Joel 的大唠嗑

Search

❯

❯

❯

LLM 新闻

Aug 05, 2025, 2 min read

25/04/02

模型

字节的即梦发了3.0 模型。生成图片上的文字能力(特别是中文)很强。整体效果接近 GPT-4o。改图能力的还差了点。

25/03/X

工具

VSCode Version 1.99 支持 MCP。方式是支持 Agent Mode。需要在配置中打开。这个版本还是有 bug，即使打开了支持 Agent Mode 后，有时还是找不到 Agent Mode 选项。配置的 MCP Server 也找不到。

25/03/26

模型

OpenAI 发布了 GPT-4o 多模态生图。图片生成效果很好。比 Gemini 好。也能改图。GPT-4o多模态生图正式上线 - 用嘴改图，此为王道

Gemini 发布 2.5 Pro 实验版。是个推理模型。上下文达到 100万 tokens。可以在 Ai Studio 里体验。

25/03/21

模型

OpenAI 发布了

新的语音转文本模型(STT): gpt-4o-transcribe,gpt-4o-mini-transcribe。说是价格和效果都比 whisper 好。
新的文本转语音模型(TTS): gpt-4o-min-tts。支持设定说话的风格。比如: “用娇滴滴的语气”。据说效果不够好。
调试语音的 Playground: OpenAI.fm

25/03/19

英伟达 GTC 大会

模型

Gemini 支持 Canvas。可以生成文档和 HTML(支持预览)。

25/03/12

模型

Google 发布了

轻量级开源模型 Gemma 3。
多模态 Gemini 2.0 Flash Experimental 模型。支持图片生成和编辑。

25/03/11

模型

Openai 发布了 Responses API⁠，内置工具(网络搜索, 计算机使用) 和 Agents SDK。

Graph View

25/04/02
模型
25/03/X
工具
25/03/26
模型
25/03/21
模型
25/03/19
英伟达 GTC 大会
模型
25/03/12
模型
25/03/11
模型

Backlinks

LLM

Created with Quartz v4.1.5, © 2025

GitHub