在最新发布的论文中,英伟达推出的 jet-nemotron 系列混合架构语言模型在多项基准测试中表现优异,精度上超越或媲美 qwen3、qwen2.5、gemma3 和 llama3.2,同时实现了最高达 53.6 倍的生成吞吐量提升和 6.1 倍的预填充加速。与当前先进的 moe 全注意力模型如 deepseek-v3-small 和 moonlight 相比,jet-nemotron-2b 在 mmlu 和 mmlu-pro 等数学任务上的准确率也更胜一筹。
在 N...
干冰,生活中非常常见的一种保鲜材料。
网上买了生鲜,卖家会在里面放上好多干冰防止食物变质,有些餐饮店在上菜、做鸡尾酒时,为了营造“仙气飘飘”的效果,也会使用干冰……
但你知道吗,干冰如果储存、使用不当,其实超级危险!!!
前段时间,湖南的一名 14 岁的小孩在爸爸网购冰激凌的箱子里发现了用于冷藏的干冰,以为是玩具,便捏在手里反复摇晃。
结果密封袋里的干冰突然爆炸,小朋友的右手瞬间鲜血直流,拇指虎口处被撕开一道约 10 厘米的伤口,拇指骨折。
图片来源于网络
类...
上海交通大学 ipads 实验室团队近日发布了一款名为 mobiagent 的全新移动端智能体工具链,成功突破了个性化智能助手开发的技术瓶颈。该团队宣称,mobiagent 在真实应用场景中的表现已超越 gpt-5 及其他顶尖闭源模型。
论文地址:https://www.php.cn/link/609e37f3e61f118ba50b9ba0e49f5cdc
MobiAgent 的诞生使得普通用户也能打造专属于自己的 AI 助手。这一工具链提供了从操作数据采集、模型训...
Anthropic 正式宣布,Claude AI 现已支持直接生成和编辑 Excel 表格、Word 文档、PowerPoint 演示文稿以及 PDF 文件。这一全新能力通过 Claude.ai 平台及其桌面应用程序实现,标志着 Claude 不再局限于文字对话或图像识别,而是能够输出可下载、可实际使用的标准文件格式。
当前,该「文件创建」功能正处于预览阶段,已向 Max、Team 和 Enterprise 订阅用户开放。Pro 用户预计将在未来几周内陆续获得访问权...
近日,小米集团新一代 Kaldi 团队推出了基于 Flow Matching 框架的 ZipVoice 系列语音合成(TTS)模型,包括 ZipVoice(零样本单人语音合成模型)和 ZipVoice-Dialog(零样本对话语音合成模型)。
作为 zipformer 架构在语音生成领域的延伸与实践,ZipVoice 有效缓解了当前零样本语音合成模型普遍存在的模型参数庞大、推理速度缓慢等问题,在模型轻量化与生成效率方面实现了显著提升。而 ZipVoice-Dialo...
距离初代mate xt问世已经过去一年,折叠屏行业却始终没有出现第二款量产的三折叠手机。许多厂商曾放出概念视频或样机,但真正将三折叠技术推向成熟产品并大规模量产的,依旧只有华为。
Mate XT以其独特的形态证明了三折叠的可行性,如今,华为再次更新这条产品线,带来了Mate XTs 非凡大师。
相比前作,Mate XTs不仅在硬件细节上做了打磨,更在软件适配、AI整合和交互体验方面实现了全方位升级。它的定位不只是折叠屏手机,而是“口袋PC”,一台能够随身携带的多任...
anthropic 推出 claude api 新功能 web fetch,可直接从任意网页 url 获取并解析内容,无需额外搭建基础设施。
该功能目前已开放公测。开发者仅需在请求头中添加 anthropic-beta: web-fetch-2025-09-10 即可激活此功能,使 Claude 能够自动抓取并处理指定网页或PDF文件的全部内容,无需依赖外部服务。
在调用过程中,Claude 将根据提示语和提供的 URL 自主判断是否执行抓取操作,API 返回的内...
阿里巴巴通义实验室推出了全新的端到端语音识别大模型 funaudio-asr。该模型引入创新的 context 模块,显著提升了在高噪声环境下的识别稳定性,将幻觉率从 78.5% 大幅下降至 10.7%,降幅接近 70%。
FunAudio-ASR 基于数千万小时的真实音频数据训练而成,并深度融合了大语言模型的语义理解能力,在远场、嘈杂背景及多说话人等复杂场景中表现出色,性能超越 Seed-ASR、KimiAudio-8B 等当前主流系统。
为满足不同应用场景需求...
iOS 26带来六大更新:1. 全新“液态玻璃”设计,界面半透明且具3D动态效果;2. Apple Intelligence集成AI功能,支持实时翻译、智能摘要和屏幕内容识别;3. 通信升级,新增通话录音、等待助理及信息群聊投票;4. 相机简化界面并增加镜头清洁提示,照片App增强AI编辑;5. 自适应省电模式仅限iPhone 15 Pro及以上机型,可智能调节性能延长续航;6. 其他更新包括CarPlay新UI、Apple Music自动混音、地图足迹记录及iPhone版P...
IBM 正式推出 Granite-Docling-258M,一款面向端到端文档转换的开源视觉语言模型。与传统 OCR 技术不同,该模型专注于保留原始文档的布局结构,能够精准识别并提取表格、代码段、数学公式、列表、标题等复杂元素,并生成具备完整结构信息的机器可读输出,而非仅输出简化版的 Markdown。
作为 SmolDocling-256M 的升级版本,Granite-Docling 在架构层面进行了多项优化:采用 Granite165M 作为其语言解码核心,将视...