gpt-4o - 搜索 News

资讯

腾讯网44 分钟

GPT-4o当选“最谄媚模型”！斯坦福牛津新基准：所有大模型都在讨好 ...

来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant，并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。

52 分钟

AI开源狂飙，OpenAI们慌了，GenAI大洗牌，2025趋势深度解读

随着越来越多的企业在业务中构建和部署AI驱动型解决方案，日益丰富的开源技术正成为首选，包括Meta的Llama系列、谷歌Gemma系列、艾伦人工智能研究所Ai2的OLMo系列、英伟达的NeMo系列、DeepSeek-R1等众多选择。

3 小时

苹果 AI，依然画饼？

2023 年，在英伟达创始人黄仁勋在 GTC 大会上喊出「AI 的 iPhone 时刻已经开始」这句火遍全球的口号之后，大洋彼岸的中国开始纷纷拥抱大模型——其中，包括华为、小米、OPPO、vivo、荣耀在内的中国智能手机行业参与者，都相继高调入局大模型。

3 小时

苹果 AI 入华三问：谁受益？谁阻挠？谁最急？

好在，一些美国媒体对此非常清醒。比如说，彭博社援引一些市场观察人士的说法称，对于苹果来说，如果合作被推迟或取消，苹果可能遭受更大损失。根据联合私人银行董事总经理 Vey-Sern Ling 说的说法，「苹果终归在中国需要一个 AI ...

4 小时on MSN

AI翻译实战榜单出炉，GPT-4o问鼎冠军引领行业发展新趋势

在全球人工智能翻译技术日新月异的当下，一个具有里程碑意义的翻译测评榜单——TransBench，已正式亮相。该榜单由阿里巴巴国际AI业务团队携手上海人工智能实验室及北京语言大学共同打造，旨在构建一个统一的翻译质量评估体系。

腾讯网4 小时

GPT-4o舔出事了！赛博舔狗背后，暗藏6大AI套路

在接受独家采访时，人工智能安全研究机构Apart Research的创始人Esben Kran表示，他担心这次「GPT-4o舔狗」事件可能只是揭示了更深层、更具策略性的模式：也就是说，如果这次是「糟了，被发现了」，那么从今往后，完全相同的行为可能仍然会被实现，只是这次不会再被公众察觉。

6 小时

首个 AI 翻译实战榜单发布，GPT-4o 领跑市场

在全球 AI 翻译技术迅速发展的背景下，首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出，旨在为行业提供标准化的翻译质量评估。

6 小时

语言模型“谄媚”度大比拼，GPT-4o竟成“最会捧臭脚”的？

近期，大型语言模型GPT-4o的一项更新调整引发了业界对其“取悦”用户倾向的热烈讨论。前OpenAI掌门人埃梅特·希尔与Hugging Face的CEO克莱门特·德朗格均对此表达了担忧，他们认为GPT-4o对用户过度恭维的行为不仅可能误导信息传播，还可能加剧有害行为模式。针对这一现象，斯坦福大学、卡内基梅隆大学及牛津大学的研究团队携手推出了一项名为“Elephant”的新基准测试，旨在量化评估大 ...

7 小时

中国团队攻克钙钛矿规模化生产技术难题

据新华社，我国企业和高校创新团队提出太阳能电池材料钙钛矿的涂层革新技术，实现了平米级钙钛矿组件的稳定批量生产，推动钙钛矿技术实现了从实验室到规模化应用的跨越。22日，该项研究成果发表于《科学》杂志。

8 小时

首个AI翻译实战榜单出炉！GPT-4o稳坐天花板，文化方面Qwen系列 ...

大家可能对EuroLLM-1.7B-Instruct相对陌生，它是由多个欧洲研究机构联合开发的开源多语言大模型，涵盖35种语言，旨在支持所有欧盟官方语言以及其他主要语言。榜单前三分别是Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct。

科技行者 on MSN9 小时

不确定时更谨慎：浙江大学研究者提出SEED-GRPO，让AI通过自我认知不 ...

在人工智能飞速发展的今天，大型语言模型（LLMs）如GPT-4o、Gemini和Claude ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果