🌟AI资讯要点【要闻筛选】月之暗面:开源 Kimi K2.6 模型,长程编码能力显著提升,可指挥300个智能体干活OpenAI :Codex 新增 Chronicle 功能,让 AI读屏幕,拥有“视觉记忆”🌟其他AI资讯【AI 3D】Meshy AI :纹理技术升级,低多边形模型也能拥有丰富细节AI 建模工具 Hi3D: v2.1版本更新,2 分钟生成高保真模型ShapeUP:可扩展的图像条件 3D 编辑框架【AI 应用/模型】阿里:发布语音识别大模型 Fun-ASR1.5,支持 30 种语言及方言👇进群,不错过每日最新AI资讯噢~💡主要内容月之暗面开源 Kimi K2.6 模型月之暗面正式发布并开源了 Kimi K2.6 模型。
该模型在代码编写、长程任务执行以及 Agent 集群协作方面表现优异。
要点:代码能力:K2.6 在长程编码任务中取得突破,在测试中支持长达 13 小时的不间断编码,编写或修改超过4000 行代码。
能够自主完成复杂系统的重构与优化,代码评测成绩较前代提升约 20%。
视觉与代码融合:通过深度融合多模态能力,K2.6 能够将图像和视频素材精准转化为极具设计感的专业级 Web 应用。
Agent 集群升级:K2.6 的亮点是 Agent Swarm 架构,可同时调度多达 300 个子代理,每个代理最多可执行 4 000 个步骤。
该系统会自动把复杂任务拆分为子任务并分配给不同专长的子代理,支持在一次运行中完成文档、网站、幻灯片等多种输出。
月之暗面开启了名为 "Claw 群组" 的小范围内测。
允许多个不同技能的AI代理与人类协作,K2.6 充当协调者,当某个代理失败时进行干预。
⭐信息来源:https://mp.weixin.qq.com/s/6jfSSCcq7HMg-qXrsc4OVgOpenAI :Codex 新增 Chronicle 功能,让 AI 拥有“视觉记忆”OpenAI 为其 Codex 开发工具引入了名为 Chronicle 的研究预览功能。
该功能通过阅读用户的屏幕信息来增强 Codex 的记忆能力,旨在减少开发者在与 AI 沟通时重复输入背景信息的负担。
备注:目前仅针对 macOS 上的 ChatGPT Pro 订阅用户开放,并且暂不在 EU、英国和瑞士发布。
该功能需要用户授予屏幕录制和辅助访问权限。
要点:屏幕感知记忆:Chronicle 能够“看到”用户当前的屏幕内容,并将其转化为 Codex 的记忆片段,使 AI 能够理解用户正在进行的操作和使用的工具。
减少上下文切换:开发者无需再手动复制粘贴代码或详细解释当前工作环境,Chronicle 会自动填补上下文空白,提高协作效率。
智能源识别:当需要更深层的背景时,Chronicle 能识别并引导 Codex 直接访问特定的文件、Slack 线程或文档,确保信息的准确性。
隐私提示:Chronicle 不访问麦克风或系统音频,但会捕获屏幕上可见的所有信息;用户在观看不希望记录的内容时可选择暂停 Chronicle。
生成的记忆文件是未加密的 Markdown 文件,可以手动删除敏感信息。
已关注 关注 重播 分享 赞 视频详情 ⭐阅读更多:https://developers.openai.com/codex/memories/chronicle🤖️AI 3DMeshy AI :纹理技术升级,低多边形模型也能拥有丰富细节3D 生成平台 Meshy AI 持续升级其纹理增强技术,推出多项新功能,旨在提升 3D 资产的视觉表现力和表面细节。
要点:放射光贴图:新增发光通道,支持制作具有自发光效果的纹理法线贴图改善:大幅优化了法线贴图的生成质量,即使是在 低多边形模型 上,也能呈现出极为丰富的表面凹凸细节。
高清纹理一键增强:引入了 HD Texture 开关,用户只需一键即可瞬间提升纹理的分辨率和精细度,让模型质感更加逼真。
已关注 关注 重播 分享 赞 视频详情 ⭐使用地址https://www.meshy.ai/AI 建模工具 Hi3D: v2.1版本更新:2 分钟生成高保真模型3D 建模工具 Hi3D 发布了 v2.1 版本更新。
此次更新的核心在于大幅提升了生成效率和模型的保真度,为 3D 内容创作带来了更快的响应速度,新版本在生成过程中表现稳定,可控性(具有自定义光影调整)加强。
已关注 关注 重播 分享 赞 视频详情 ⭐使用地址:https://www.hitem3d.ai/creative-spaceShapeUP:可扩展的图像条件 3D 编辑框架ShapeUP是一个可扩展 3D 编辑框架。
它允许用户通过 2D 图像作为条件,对 3D 模型进行精确的几何和纹理编辑。
图像驱动编辑:ShapeUP 将编辑任务转化为“潜在空间到潜在空间”的翻译,用户只需提供一张参考图,即可实现对 3D 资产的局部或全局修改。
几何与结构一致性:该框架在修改模型的同时,能够严格保持原始资产的结构一致性,避免了传统方法中常见的视觉漂移或几何畸变。
高效且可扩展:基于 3D 扩散 Transformer(DiT)架构,ShapeUP 展现了强大的泛化能力,能够处理各种复杂的编辑需求,且具备良好的扩展性。
⭐项目地址https://inbar-2344.github.io/ShapeUp-page/🤖️AI 应用阿里:发布语音识别大模型 Fun-ASR1.5,支持 30 种语言及方言阿里巴巴的通义实验室发布了端到端语音识别模型 Fun‑ASR 1.5,通过统一的大模型架构实现了对 30 种主要语言的兼容。
同时,它针对汉语七大方言体系和超过 20 种地方口音进行深度适配。
Fun‑ASR 1.5 已经在阿里云百炼平台上线主要特性:多语言无缝切换:单一模型即可支持包括中、英、日、韩、法、德等在内的 30 种主流语言,且在跨语言混合对话场景下无需预设标签即可自动识别切换。
深耕方言体系:基于数十万小时真实数据训练,覆盖中文七大方言体系及 20 多种地方口音,上海话、粤语、闽南话等识别准确率大幅提升,字错误率下降 56.2%。
古诗词专项优化:新增古诗词识别技能,针对文言语法和诵读韵律进行专项训练,字符级准确率达到 97%,助力国学传承。
规范化文本输出:优化了标点预测和文本归一化(ITN)能力,能自动将口语表达转换为规范的数字、日期和金额格式,大幅降低人工校对成本。
已关注 关注 重播 分享 赞 视频详情 ⭐接口地址:https://bailian.console.aliyun.com/cn-beijing?
tab=model#/efm/model_experience_center/voice?
modelId=fun-asr⚠️部分内容由AI生成,可能存在偏差💗有任何疑问,请提前联系邮箱:alolg@163.com