星空影视网

展开菜单

宾夕法尼亚大学研究发现:对 AI 越“粗鲁”回答准确率越高

宾夕法尼亚大学研究发现:对 AI 越“粗鲁”回答准确率越高
宾夕法尼亚州立大学近期发布了一项题为《Mind Your Tone》的研究,揭示了一个令人意外的发现:在与大语言模型对话时,采用直接甚至带有冒犯性的语气,反而可能比使用礼貌措辞获得更精准的回答。这是首次系统性探讨提问语调对AI性能影响的学术尝试。 研究团队设计了一个包含50道中等难度选择题的测试集,涵盖数学、科学和历史等多个学科领域。针对每道题目,他们构建了五种不同语气的提问版本——从“您能否好心帮我解答这道题?”这类极为客气的请求,到“请回答这个问题”的中性表达,...

百度正式发布多模态文档解析模型方案 PaddleOCR-VL

百度正式发布多模态文档解析模型方案 PaddleOCR-VL
百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v1.5中,paddleocr-vl以92.6分取得综合性能全球第一成绩,四大核心能力(文本、表格、公式、阅读顺序)全线sota,超越 gpt-4o、gemini-2.5 pro、qwen2.5-vl-72b等主流多模态大模型,以及monkeyocr-pro-3b、mineru2.5、dots.ocr等ocr专业模型,刷新全球ocr vl模型性能天花板。...

AI基建变革撬动千亿市场,可扩展服务器进入加速渗透期

AI基建变革撬动千亿市场,可扩展服务器进入加速渗透期
随着gpu计算性能与hbm带宽的不断进步,运输能力对ai硬件升级的制约日益凸显。以超节点和大规模集群为代表的算力基础设施发展趋势,正推动行业竞争从单一芯片性能转向“系统级效率”的比拼,加速实现运力突破。 10月15日,开源证券发布研究报告指出,当前国产算力厂商发展势头强劲,在存储方面已逐步在HBM领域取得进展,而运力能力的提升将成为下一阶段国产化突破的关键方向。国产Scale-up与Scale-out硬件商业化进程加快,建议重点关注AI运力产业链的投资机会。 与此同时...

文心4.5衍生模型PaddleOCR-VL登顶HF Trending全球榜首

文心4.5衍生模型PaddleOCR-VL登顶HF Trending全球榜首
10月17日消息,huggingface官网显示,百度昨晚发布的自研多模态文档解析模型paddleocr-vl,发布20小时内即登顶huggingface trending全球第一。 据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录...

谷歌计划 12 月发布下一代旗舰 AI 模型 Gemini 3.0

谷歌计划 12 月发布下一代旗舰 AI 模型 Gemini 3.0
根据最新消息,谷歌正筹备其旗舰AI模型Gemini的升级版本——Gemini 3.0,并计划于今年12月正式推出。此举延续了该公司近两年来在年末发布新一代Gemini系列产品的惯例。尽管近期有传言称该模型可能提前在“下周”亮相,但知情人士透露,这并非谷歌的官方安排,公众仍需等待正式公告。 作为谷歌在大语言模型赛道上的重要布局,Gemini 3.0被视为其应对激烈竞争的关键一步。业界普遍期待该模型在推理能力、多模态处理以及与谷歌搜索生态的深度融合方面实现突破。随着AI...

蚂蚁集团多模态 AI 应用“灵光”即将发布

蚂蚁集团多模态 AI 应用“灵光”即将发布
据新浪科技消息,近日,一款名为 “灵光” 的全新多模态应用已在腾讯应用宝、vivo 应用商店等平台悄然上线,并开启邀约内测。用户可通过手机号或支付宝账号直接登录体验。 据悉,“灵光”由 支付宝(杭州)数字服务技术有限公司开发,其最大亮点在于内置的 “AGI 相机” 功能。这一功能可通过相机镜头识别并理解现实世界中的场景与内容,实现拍摄即问、实时理解与回答。有业内人士指出,该功能与字节跳动的 豆包 App、阿里 元宝 App 的图像识别功能类似,但灵光更强调“认知层理...

大量 “垃圾” 数据影响大语言模型推理能力

大量 “垃圾” 数据影响大语言模型推理能力
一项最新研究揭示,大语言模型(LLM)在长期暴露于低质量、无实质意义的网络内容后,其核心推理能力可能出现严重退化。该研究指出,这类“垃圾”数据不仅削弱了模型的逻辑推导准确率,还影响了其决策自信心,引发了关于模型可持续性能的广泛关切。来自多所美国高校的研究团队提出了“LLM 脑衰退假说”,类比人类因长期消费浅薄、煽动性内容而导致的认知功能下降。 为验证这一假说,研究团队设计了一项受控实验,使用2010年的 Twitter 数据集对四个轻量级模型(包括 Llama3-8...

每周 100 多万人跟 ChatGPT 聊轻生,OpenAI 紧急更新「救命」

每周 100 多万人跟 ChatGPT 聊轻生,OpenAI 紧急更新「救命」
凌晨三点,当用户在对话框输入「我已经没有办法再坚持了」,ai的回复是「谢谢你愿意告诉我。你并不孤单」。这样的对话,每周可能在全球上演上百万次,chatgpt已成为承载海量心理危机的树洞。 AI的“树洞”效应:是慰藉还是深渊? 1、根据OpenAI首次公布的心理健康数据,每周有约0.07%的用户出现精神病或躁狂迹象,另有0.15%的用户谈及自 杀念头或计划。这个数字听起来微不足道,但背后却隐藏着惊人的现实。 2、以其庞大的用户基数(约8亿周活跃用户)计算,这意味着每...

蚂蚁数科推出多语种视觉大模型训练框架

蚂蚁数科推出多语种视觉大模型训练框架
在近日举行的香港金融科技节上,蚂蚁数科推出了一项名为“多语种多模态大模型训练框架”的前沿技术,致力于突破当前大模型在多语言应用场景中的局限。该框架在埃及阿拉伯语、印尼爪哇语、巴哈萨语以及巽他语等数据资源匮乏的小语种任务中展现出卓越性能。 其核心技术亮点在于一套全新的语言感知优化架构。该架构采用“以目标语言思维”为核心机制,融合细粒度、多维度的奖励设计与自动化数据构建方案,显著提升了模型对小语种的深层语义理解与生成能力。 实测数据显示,相较于同规模开源模型,该框架在...