星空影视网

展开菜单

DuckDuckGo 在其订阅计划中添加了对高级 AI 模型的访问权限

DuckDuckGo 在其订阅计划中添加了对高级 AI 模型的访问权限
主打隐私保护的科技企业 DuckDuckGo 于去年推出订阅服务,该公司近日宣布,现有订阅用户现已可免费通过其 Duck.ai 平台使用前沿的人工智能模型。 Duck.ai 的聊天功能对所有用户开放,无需付费即可体验多种主流AI模型,例如 Anthropic 的 Claude 3.5 Haiku、Meta 的 Llama 4 Scout、Mistral AI 的 Mistral Small 3 24B,以及 OpenAI 的 GPT-4o mini。 而每月支付...

“Nano Banana”上线不到 10 天,为谷歌 Gemini 吸引超过 1000 万名新用户

“Nano Banana”上线不到 10 天,为谷歌 Gemini 吸引超过 1000 万名新用户
谷歌最新推出的 AI 实验项目“Nano Banana”上周迅速走红。谷歌实验室副总裁 Josh Woodward 在 X 平台透露,该功能上线后,已累计完成超过 2 亿次图像编辑操作,成功吸引超过 1000 万新用户首次使用 Gemini 应用。 谈及这一现象级热度,他幽默表示:“TPU 几乎被压垮,SRE 的警报声就没停过。” Gemini 2.5 Flash Image(内部代号 Nano Banana)是谷歌当前最先进的图像生成与编辑模型,具备以下核心优势...

快手发布开源多模态大模型 Kwai Keye-VL-1.5

快手发布开源多模态大模型 Kwai Keye-VL-1.5
快手近日正式推出了多模态大语言模型keye-vl-1.5-8b。 https://www.php.cn/link/5831e536b6f7828e911b47c0f2525161 据悉,相较于前代版本,Keye-VL-1.5在整体性能上实现了显著跃升,尤其在基础视觉理解方面表现亮眼,涵盖视觉元素识别、逻辑推理以及时序信息处理等多个维度。该模型在同参数规模中处于领先水平,部分能力甚至超越了如GPT-4o等闭源模型。 Keye-VL-1.5采用了四阶段渐进式训练...

百度 PaddleOCR 累计下载量突破 900 万,被超 5.9k 开源项目使用

百度 PaddleOCR 累计下载量突破 900 万,被超 5.9k 开源项目使用
近日,百度通过其海外官方账号发布了全新的轻量级文字识别模型 pp-ocrv5。该模型参数量仅为0.07b,在仅千分之一的参数规模下,实现了与拥有700亿参数的大模型相当的ocr识别精度。在多个ocr应用场景的测试中,pp-ocrv5的表现优于gpt-4o、qwen2.5-vl-72b等大型通用视觉模型。目前,飞桨团队发布的相关技术博客已连续七天位居hugging face博客热度榜首位,引发开发者社区的高度关注。 据悉,2025年5月,飞桨团队正式推出PaddleO...

小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio
小米正式宣布开源其首个原生端到端语音模型——xiaomi-mimo-audio。该模型基于创新的预训练架构,并利用超过一亿小时的海量语音数据进行训练,首次在语音领域实现了基于上下文学习(icl)的少样本泛化能力,且在预训练过程中观察到了显著的“涌现”现象。 官方指出,经过后训练优化,Xiaomi-MiMo-Audio 在智能理解、情感表达、语音表现力以及安全性等方面展现出卓越的跨模态对齐能力,使得语音交互在自然度、情绪传递和对话连贯性上达到了高度拟人化的水平。 Xia...

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5 Blog持续登顶Hugging Face热度第一
近日,百度通过其海外官方账号发布了最新的轻量级文字识别模型pp-ocrv5。该模型仅含0.07b参数,以千分之一的参数规模实现了与拥有700亿参数的大模型相媲美的ocr精度表现。在多项ocr任务测试中,pp-ocrv5的表现优于gpt-4o、qwen2.5-vl-72b等通用视觉大模型。目前,飞桨团队发布的相关技术博客已连续七天位居hugging face博客热度榜榜首,引发开发者社区广泛关注。 ☞☞☞☞点击夸克AI手把手教你,操作像呼吸一样简单!☜☜☜☜...

字节跳动推出多语言翻译模型 Doubao-Seed-Translation

字节跳动推出多语言翻译模型 Doubao-Seed-Translation
近日,字节跳动旗下火山引擎正式发布自主研发的多语言翻译模型——Doubao-Seed-Translation,该模型支持数十种语言之间的互译。 据官方介绍,Doubao-Seed-Translation 在中英文翻译任务上的表现接近 Deepseek-R1 水准,而在通用多语言翻译能力方面,性能达到甚至超越 GPT-4o 与 Gemini-2.5-Pro,能够精准满足办公、娱乐等多种应用场景下的翻译需求。 模型定价详情 输入 (元/百万 token)...

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash
阿里通义qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——qwen3-tts-flash。该模型不仅支持多种语言和音色输出,还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言,展现出强大的语言适应能力。 在性能表现上,Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度,达到当前最先进的SOTA水平。同时,官方已同步推出API接口、在线D...

OpenAI CEO透露将推计算密集型新功能,部分仅限Pro用户

OpenAI CEO透露将推计算密集型新功能,部分仅限Pro用户
OpenAI CEO Sam Altman 最近在一则社交媒体动态中透露,公司计划在未来几周内发布一系列新服务。由于这些功能对计算资源的需求显著增加,相关成本也大幅上升,因此在初期阶段将仅向 Pro 订阅用户开放。同时,部分新产品还将设置额外收费。 Altman 指出,尽管初期访问会有所限制,但 OpenAI 的长期愿景始终是降低人工智能服务的成本,推动其更广泛的普及。他对技术的未来发展持乐观态度,并坚信团队最终能够实现让更多人平等地使用先进智能工具的目标。 该帖...

Perplexity AI 将 Comet 浏览器扩展至印度 Pro 用户

Perplexity AI 将 Comet 浏览器扩展至印度 Pro 用户
近日,人工智能搜索企业 perplexity 宣布其革命性浏览器 comet 正式向印度地区的所有 perplexity pro 用户开放,成为继美国之后第二个全面接入该服务的国家。此次上线即日生效,致力于为用户提供由 ai 驱动的智能浏览体验,助力自动化操作并提升在高速发展的数字环境中的工作效率。 Comet 浏览器于2025年7月首次发布,是一款基于 Chromium 架构的“AI 代理”型浏览器,深度融合了 Perplexity 自研的 Sonar LLM,并整合...