gpt-4_星空影视网

DuckDuckGo 在其订阅计划中添加了对高级 AI 模型的访问权限

主打隐私保护的科技企业 DuckDuckGo 于去年推出订阅服务，该公司近日宣布，现有订阅用户现已可免费通过其 Duck.ai 平台使用前沿的人工智能模型。 Duck.ai 的聊天功能对所有用户开放，无需付费即可体验多种主流AI模型，例如 Anthropic 的 Claude 3.5 Haiku、Meta 的 Llama 4 Scout、Mistral AI 的 Mistral Small 3 24B，以及 OpenAI 的 GPT-4o mini。而每月支付...

2026-01-09/ 66 次浏览/ 资讯

“Nano Banana”上线不到 10 天，为谷歌 Gemini 吸引超过 1000 万名新用户

谷歌最新推出的 AI 实验项目“Nano Banana”上周迅速走红。谷歌实验室副总裁 Josh Woodward 在 X 平台透露，该功能上线后，已累计完成超过 2 亿次图像编辑操作，成功吸引超过 1000 万新用户首次使用 Gemini 应用。谈及这一现象级热度，他幽默表示：“TPU 几乎被压垮，SRE 的警报声就没停过。” Gemini 2.5 Flash Image（内部代号 Nano Banana）是谷歌当前最先进的图像生成与编辑模型，具备以下核心优势...

2026-01-09/ 61 次浏览/ 资讯

快手发布开源多模态大模型 Kwai Keye-VL-1.5

快手近日正式推出了多模态大语言模型keye-vl-1.5-8b。 https://www.php.cn/link/5831e536b6f7828e911b47c0f2525161 据悉，相较于前代版本，Keye-VL-1.5在整体性能上实现了显著跃升，尤其在基础视觉理解方面表现亮眼，涵盖视觉元素识别、逻辑推理以及时序信息处理等多个维度。该模型在同参数规模中处于领先水平，部分能力甚至超越了如GPT-4o等闭源模型。 Keye-VL-1.5采用了四阶段渐进式训练...

2026-01-09/ 64 次浏览/ 资讯

百度 PaddleOCR 累计下载量突破 900 万，被超 5.9k 开源项目使用

近日，百度通过其海外官方账号发布了全新的轻量级文字识别模型 pp-ocrv5。该模型参数量仅为0.07b，在仅千分之一的参数规模下，实现了与拥有700亿参数的大模型相当的ocr识别精度。在多个ocr应用场景的测试中，pp-ocrv5的表现优于gpt-4o、qwen2.5-vl-72b等大型通用视觉模型。目前，飞桨团队发布的相关技术博客已连续七天位居hugging face博客热度榜首位，引发开发者社区的高度关注。据悉，2025年5月，飞桨团队正式推出PaddleO...

2026-01-09/ 67 次浏览/ 资讯

小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

小米正式宣布开源其首个原生端到端语音模型——xiaomi-mimo-audio。该模型基于创新的预训练架构，并利用超过一亿小时的海量语音数据进行训练，首次在语音领域实现了基于上下文学习（icl）的少样本泛化能力，且在预训练过程中观察到了显著的“涌现”现象。官方指出，经过后训练优化，Xiaomi-MiMo-Audio 在智能理解、情感表达、语音表现力以及安全性等方面展现出卓越的跨模态对齐能力，使得语音交互在自然度、情绪传递和对话连贯性上达到了高度拟人化的水平。 Xia...

2026-01-09/ 68 次浏览/ 资讯

超越GPT-4o及Qwen2.5-VL，百度超轻量模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

近日，百度通过其海外官方账号发布了最新的轻量级文字识别模型pp-ocrv5。该模型仅含0.07b参数，以千分之一的参数规模实现了与拥有700亿参数的大模型相媲美的ocr精度表现。在多项ocr任务测试中，pp-ocrv5的表现优于gpt-4o、qwen2.5-vl-72b等通用视觉大模型。目前，飞桨团队发布的相关技术博客已连续七天位居hugging face博客热度榜榜首，引发开发者社区广泛关注。 ☞☞☞☞点击夸克AI手把手教你，操作像呼吸一样简单！☜☜☜☜...

2026-01-09/ 62 次浏览/ 资讯

字节跳动推出多语言翻译模型 Doubao-Seed-Translation

近日，字节跳动旗下火山引擎正式发布自主研发的多语言翻译模型——Doubao-Seed-Translation，该模型支持数十种语言之间的互译。据官方介绍，Doubao-Seed-Translation 在中英文翻译任务上的表现接近 Deepseek-R1 水准，而在通用多语言翻译能力方面，性能达到甚至超越 GPT-4o 与 Gemini-2.5-Pro，能够精准满足办公、娱乐等多种应用场景下的翻译需求。模型定价详情输入 (元/百万 token)...

2026-01-09/ 65 次浏览/ 资讯

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

阿里通义qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——qwen3-tts-flash。该模型不仅支持多种语言和音色输出，还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言，展现出强大的语言适应能力。在性能表现上，Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度，达到当前最先进的SOTA水平。同时，官方已同步推出API接口、在线D...

2026-01-09/ 63 次浏览/ 资讯

OpenAI CEO透露将推计算密集型新功能，部分仅限Pro用户

OpenAI CEO Sam Altman 最近在一则社交媒体动态中透露，公司计划在未来几周内发布一系列新服务。由于这些功能对计算资源的需求显著增加，相关成本也大幅上升，因此在初期阶段将仅向 Pro 订阅用户开放。同时，部分新产品还将设置额外收费。 Altman 指出，尽管初期访问会有所限制，但 OpenAI 的长期愿景始终是降低人工智能服务的成本，推动其更广泛的普及。他对技术的未来发展持乐观态度，并坚信团队最终能够实现让更多人平等地使用先进智能工具的目标。该帖...

2026-01-09/ 62 次浏览/ 资讯

Perplexity AI 将 Comet 浏览器扩展至印度 Pro 用户

近日，人工智能搜索企业 perplexity 宣布其革命性浏览器 comet 正式向印度地区的所有 perplexity pro 用户开放，成为继美国之后第二个全面接入该服务的国家。此次上线即日生效，致力于为用户提供由 ai 驱动的智能浏览体验，助力自动化操作并提升在高速发展的数字环境中的工作效率。 Comet 浏览器于2025年7月首次发布，是一款基于 Chromium 架构的“AI 代理”型浏览器，深度融合了 Perplexity 自研的 Sonar LLM，并整合...

2026-01-09/ 60 次浏览/ 资讯

‹‹ 1 2 3 4 5 › ››