最新研究显示,AI搜索工具在回答问题时超过60%的概率提供不正确或误导性信息,严重威胁新闻可信度。该研究指出,包括ChatGPT在内的AI聊天机器人常提供错误信息,忽视出版商限制,导致新闻机构面临流量和收入损失的双重危机。研究呼吁AI公司提升透明度、准确性和对出版商权益的尊重
在最新播客中,OpenAI首席产品官凯文・维尔预测,AI将在2025年底超越人类程序员,成为卓越的编码者。Anthropic与OpenAI的高级模型正推进编码自动化,预计未来几乎所有代码将由AI生成。OpenAI即将推出的新模型在编码基准测试中的排名显著提升,显示AI在编程领域的持续进步
小米大模型团队采用强化学习算法在MMAU音频理解评测中取得领先成果,准确率高达64.5%,超越当前最佳模型近10个百分点,标志着强化学习在音频推理领域的重大突破。团队利用DeepSeek-R1启发,通过GRPO方法显著提升模型推理能力,为智能听觉技术的发展奠定了基础
全球首款通用AI智能体Manus正式微博上线,以其卓越的自主完成任务能力引发广泛关注。Manus能够实现知行合一,直接交付成果,被视为下一代人机协作的范式。尽管邀请码一码难求,官方强调将有序释放,确保用户体验
人工智能领域领军人物李开复创办的“零一万物”公司,于2025年3月推出万智企业大模型一站式平台,旨在为企业提供定制化AI解决方案,提升信息检索准确性和召回率。该平台聚焦轻量化模型开发,降低技术门槛,助力中小企业高效应用AI技术,推动产业转型升级
小米大模型团队成功将强化学习算法应用于音频推理领域,以64.5%的准确率领先MMAU音频理解评测榜,开源相关技术,为音频推理研究提供新方向
钉钉推出AI客服助理功能,实现自动接入多平台,提供7×24小时精准、高效服务。该功能已获700多家企业采用,通过智能对话及深度理解用户需求,显著提升客户服务体验。钉钉AI助理支持快速部署至微信等外部平台,简化企业知识体系构建,并通过多平台部署能力,增强企业服务能力
腾讯混元将于3月18日至19日举办开源日活动,重点展示3D生成大模型2.0版本及一站式3D内容AI创作引擎。活动旨在促进开发者交流合作,同时为3D爱好者提供学习与体验前沿技术的机会
杭州深度求索人工智能公司近日申请注册多枚“DeepSeek Chat”商标,涉及教育娱乐与广告销售等领域,目前处于注册申请阶段
本文摘要:近期,墨尔本一出版社请求作者授权使用作品训练AI,引发版权与知识产权讨论。AI训练涉及复制权问题,未经授权使用作品可能构成侵权。专家建议需确保数据集透明度,并呼吁完善法律框架以保护创作者权益。政府应对此采取紧急措施,以应对技术发展带来的挑战
香港正积极转型为科技创新中心,面临AI专业人才需求激增,超过2000个相关职位将在职业博览会上展出。超过580家机构参展,其中70%寻求AI人才,智能生活行业成为招聘主力,教育科技职位占比最大。香港职业市场正经历技术革命,AI成为经济增长关键动力
仓颉社区发布智能体开发框架 Cangjie Magic,首个基于华为自研仓颉编程语言构建的大语言模型(LLM)Agent 开发平台,通过 Agent DSL 架构、MCP 协议支持和智能调度引擎重构开发范式,支持全平台适配,计划今年第三季度实现移动端调用能力
Factorio》游戏被开发为评估人工智能的新基准,通过Factorio学习环境(FLE)测试语言模型在复杂系统管理方面的能力。研究结果显示,尽管Claude3.5Sonnet表现最为突出,但所有模型在长期规划和处理复杂问题方面仍面临挑战
最新报告显示,风险投资公司a16z发布的消费者人工智能领域排名揭示了市场格局的重大变化,17家新公司进入前50名,表明AI原生应用正取代传统模式。报告特别指出,OpenAI的ChatGPT增长强劲,Deepseek成为中国市场第二大受欢迎的AI产品。视频生成和开发者工具成为新的增长引擎,图像和视频编辑工具在收入方面领先
Sakana AI的AI Scientist-v2模型自主创作并成功通过了ICLR2025研讨会双盲同行评审的科学论文,标志着AI在科研领域的突破。然而,Sakana AI出于对学术伦理的考虑,选择撤回论文,呼吁制定AI生成内容发表的规范,引发了关于学术诚信和AI参与研究的讨论
OpenAI首席产品官Kevin Weil在访谈中透露,GPT-5即将发布,且可能整合GPT系列与O系列模型能力。他预测AI代码自动化将在年内达到99%,远超行业预期。Weil强调AI将使软件开发普及化,并展望AI在语音、教育等领域的发展,预计将催生新职业形态,促进人类创造力。访谈预示了AI技术的快速进步及其在教育、创作等领域的潜在变革
Cohere公司推出1110亿参数AI模型Command A,仅需两块GPU运行,实现成本降低50%,具备256K上下文长度和23种语言支持,性能媲美领先模型,助力企业高效部署AI应用
谷歌新推出的Gemini AI模型具备去除图片水印功能,引发版权争议。该模型在实验性阶段,尽管存在局限性,但已展示出较高能力。与此同时,其他AI模型如Anthropic的Claude3.7Sonnet和OpenAI的GPT-4o明确拒绝去除水印,认为其违法且不道德。在美国版权法下,未经授权去除水印通常视为违法,谷歌对此尚未作出回应
快手旗下可灵AI全面接入DeepSeek-R1,显著提升用户AI创意内容创作效率,降低创作门槛,实现灵感至专业作品的快速转化,尤其增强文生视频场景的表现力,推动创意视频制作的专业化和普及化
英伟达在人工智能领域的投资活动显著增长,2024年参与49轮人工智能公司融资,远超此前四年总和。公司通过支持初创企业,壮大人工智能生态系统,并巩固其在AI基础设施领域的领先地位。其中包括对OpenAI、xAI、Inflection等重量级初创企业的大规模投资,展现了英伟达在构建未来科技生态系统的战略布局
近期,人工智能技术的应用导致网络水军活动成本降低,其影响力显著增强。春节期间,多部影片遭受水军恶意打分,面临撤档风险。网络水军建立起新产业链,涵盖账号注册、维护及信息变现等多个环节,对真实信息传播构成挑战
Gamma最新推出的创新功能,实现了文档和网页内容向视觉震撼展示页面的快速转换,极大简化了信息分享方式。该功能无需用户具备专业设计知识,自动提取文档精华,重塑信息呈现形式,适用于各种沟通场景,有望成为内容创作者的必备工具,引领信息处理和分享新趋势
Thera,一款由苏黎世联邦理工学院和苏黎世大学开发的任意尺度超分辨率开源模型,以其高度灵活的放大能力和内置物理观测模型显著提升图像清晰度而备受关注。该模型支持自定义放大倍数,减少失真和伪影,并以Apache-2.0许可证开源,提供预训练模型,适用于多个领域,具有广泛的应用潜力
谷歌推出的人工智能模型Gemini2.0Flash具备去除图片水印的能力,引发创作者和版权持有者关注。该模型能智能填补水印删除后的空白区域,且免费开放,增加版权风险。竞争对手如Anthropic和OpenAI的模型则明确拒绝去除水印。此事件引发关于AI技术边界及创作者权益的讨论,谷歌尚未就此发表评论
Cal AI,由18岁的扎克·亚德加里和亨利·朗马克共同创立,成为科技创业领域的瞩目焦点。该应用在推出八个月内下载量突破500万次,用户留存率高,月收入超200万美元。Cal AI利用先进图像模型技术,提供食物卡路里和营养素自动分析功能,识别准确率高达90%,在市场上获得高分评价。亚德加里和朗马克的创业故事展示了年轻创业者的技术实力和务实精神,为行业树立了新的榜样
本文介绍了图像处理领域的新兴技术——潜在桥梁匹配(LBM),由gojasper团队开发,具备高效的对象移除、光照调整、法线与深度估计及物体重新着色等功能。LBM采用创新的理念,在潜在空间中实现图像转换,展现了通用性和可扩展性,代码已开源并获社区认可
快手新一代AI平台可灵AI全面集成DeepSeek-R1模型,增强视频和图片生成功能,优化用户提示词创作,提升AI内容质量与创作效率
拓斯达公司推出新一代机器人控制平台X5,采用云边端架构,融合高性能计算与智能控制,实现数据实时传输与高效决策。该平台旨在提升企业生产力和运营效率,推动制造业数字化转型,并助力机器人行业实现技术突破与市场竞争力的提升
Anuttacon公司,由米哈游创始人蔡浩宇创立,近日推出首款AI驱动游戏《Whispers From The Star》,强调实时对话与个性化沉浸式体验。游戏以玩家与AI角色Stella的互动为核心,玩家的对话将影响故事走向和角色命运。Anuttacon团队致力于通过AI技术革新游戏互动体验,并已吸引众多顶尖人才加盟。同时,米哈游的另一项目半图科技也在开发沉浸式3D AI体验,推动虚拟陪伴游戏的
百度正式发布文心大模型4.5及文心大模型X1,两款先进模型均已在官网开放免费体验。文心4.5在多模态理解和逻辑推理上表现出色,性能超越GPT-4.5,而文心X1则专注于中文知识问答、文学创作和逻辑推理,具备长思维链和多模态能力。两款模型定价优惠,旨在推动AI应用普及和智能服务升级
清华大学高性能计算研究所与清程极智联合推出开源大模型推理引擎“赤兔 Chitu”,实现了在非英伟达 Hopper 架构 GPU 和国产芯片上原生运行 FP8 精度模型,为国产 AI 芯片应用和生态建设提供关键技术支持,有望推动国内 AI 技术迭代和创新
谷歌宣布逐步淘汰经典版Google Assistant,转向全新AI助手Gemini,旨在深化人工智能技术与语音助手的融合,提升用户体验,并计划于2025年年底前全面停用经典版本。此举标志着谷歌在智能语音助手领域的战略升级
本研究由Meta FAIR研究科学家刘壮领导,提出了一种新的动态 tanh(DyT)技术,证明了在不使用传统归一化层的情况下,Transformer架构可以实现高效的训练和推理。研究显示,DyT不仅模拟了层归一化的效果,还降低了模型训练的复杂性,为深度学习模型的优化提供了新的视角和可能性
安永报告指出,生成式人工智能将显著提升印度金融服务行业生产力,预计到2030年银行业将提高46%。金融机构正积极部署GenAI技术,其中68%将客户服务作为首要任务,大型银行加速采纳以降低成本、提升客户体验
趣巢玩具推出创新AI毛绒玩具“Ai抱抱喵”,具备AI对话系统、多感官认知阵列及记忆共生体系,实现智能陪伴与情感互动,预示着玩具行业向智能化、情感化方向发展的新趋势
国家四部门联合发布《人工智能生成合成内容标识办法》,规定AI生成内容须显著标识,旨在保护公众权益,维护社会公共利益。新规要求AI生成的文本、音频、图片和视频等在适当位置添加显式和隐式标识,并对服务提供者和网络信息内容传播服务提出具体要求。该办法将于2025年9月1日起施行
智谱华章科技有限公司成功获得珠海华发集团5亿元战略投资,继3月初获得10亿元融资后,再次获得资本支持,以加速其基座大模型GLM的技术创新与生态建设。双方合作将共建城市级GLM大模型空间,助力数字产业转型与升级,推动地方经济发展。智谱致力于通过AI技术,增强市场竞争力,并推动企业数字化转型
微软新推出.NET AI聊天网页应用模板,现处于预览阶段,旨在简化.NET环境下AI应用的开发流程。该模板基于Blazor框架,支持本地及Azure集成,提供快速构建智能聊天应用的脚手架和指导,计划未来扩展功能和模板选项
谷歌宣布升级Android Studio中的Gemini助手,引入多模态输入功能,允许开发者将图像附加到提示中,以辅助应用程序开发。该功能可在Android Studio Narwal的Canary版本中使用,支持JPEG或PNG格式图像,并能将视觉设计转化为功能性UI代码,提高开发效率
北京市依据《生成式人工智能服务管理暂行办法》规定,对采用已备案大模型能力的生成式人工智能应用实施登记管理。截至3月14日,新增34款服务完成登记,累计登记46款,包括小米AI搜索、小米AI写作等。已上线服务需公示上线编号
阿里通义实验室语音团队负责人鄢志杰,P10级别专家,已正式离职。鄢志杰是智能语音领域资深研究者,曾担任微软亚洲研究院语音组主管研究员,并在阿里巴巴负责IDST智能语音交互及达摩院机器智能语音实验室。近期,他负责开发了阿里的大模型应用“通义听悟”。离职后去向未定,有猜测其可能投身AI创业
alphaXiv,一款革命性的AI工具,通过融合Mistral OCR与Claude3.7技术,能够快速将arXiv学术论文转化为易于理解的博客文章。该工具显著提升科研文献的阅读效率,实现深度解读与便捷获取,为科研工作者和学习者提供高效学习与研究的全新途径
湖北省大冶市人民法院对首例利用AI技术撰写并传播色情小说牟利的案件作出判决,被告人柯某被判有期徒刑十个月并处五千元罚金,须退还违法所得。此案强调AI技术在创作应用中需遵守法律法规,不得用于非法牟利
全球人工智能在房地产市场应用迅猛发展,预计到2030年市场规模将达到1803.45亿美元,年复合增长率达35%。美国市场领先,Zillow、Compass等企业通过AI技术优化客户体验和物业管理。亚太、中东地区快速跟进,智能城市项目推动AI应用。欧洲市场稳步增长,德国、英国等领先,各企业积极拓展AI在房地产领域的应用
Anthropic首席执行官阿莫迪预测,人工智能将在未来数月内承担大部分代码编写工作,可能导致程序员职业的重大转变。然而,IBM和Meta的高管对此持不同看法,认为AI取代人类程序员的时间表更为长远。尽管AI在提高编程效率方面具有潜力,但对软件开发行业的就业影响仍存在争议
Sesame公司于3月13日发布新型语音合成模型CSM,采用Transformer架构,实现高自然度语音生成,支持实时调整语气与情感。CSM被视为AI语音技术的重要进展,具有高度灵活性,但目前主要针对英语训练。该模型有望重塑AI语音助手标准,推动人机对话体验革新
OpenAI 宣布其 Chat Playground 升级为 Prompts Playground,引入全新设计和高级工具,增强用户体验和创作灵活性。新平台优化了 AI 模型的交互探索,支持保存和共享配置,助力开发者和研究人员高效协作。此次更新标志着 OpenAI 在 AI 交互技术领域的进展
巨人网络宣布旗下游戏《太空杀》成功接入DeepSeek大模型,推出创新玩法“内鬼挑战”,实现AI深度参与游戏核心玩法,提升竞技与交互体验。此玩法已进入灰度测试,预计面向全量用户开放,标志着游戏行业首次将DeepSeek模型应用于游戏玩法革新
OpenAI 建议美国联邦政府统一主导人工智能监管,以推动行业创新并减少州际法规不一致。该公司提倡建立政府与私营部门的合作机制,包括“沙盒”政策以支持初创企业,并强调实施联邦法规优先权需国会支持
360智脑团队成功开发并开源了Light-R1-14B-DS模型,实现了14B参数规模下强化学习效果的突破,显著提升数学推理能力。该模型在数学竞赛任务中表现优异,采用创新训练方法,为AI推理领域的发展提供了重要资源
富士康即将公布的财报预计显示,第四季度净利润同比增长2.35%,达544亿新台币,主要由AI服务器需求驱动。尽管全球贸易紧张局势为公司前景带来挑战,但公司对第一季度业绩持乐观态度。同时,富士康与苹果的合作项目进一步证实市场对AI技术的需求
微软正在Windows操作系统的记事本应用中测试基于人工智能的摘要生成功能,允许用户通过右键菜单或快捷键快速获取文本摘要。该功能支持调整摘要长度,并需登录Microsoft账户使用。此外,微软还引入了查看最近关闭文件及改进剪切工具的新功能
中国眼科界推出AI神器“小青”,与国内顶尖医疗机构合作,共同成立“青光眼慢病管理中心”,旨在提升青光眼早期筛查、诊疗和康复管理水平。该AI模型基于深度学习技术,可提供24小时咨询服务,并结合家用监测设备,实现个性化的慢病管理。此举措有望打破青光眼隐匿性带来的诊疗难题,推动慢性眼病管理模式的完善,助力国民眼健康水平提升
英伟达公司宣布以著名天文学家Vera Rubin命名其下一代AI芯片,以表彰其在天文学领域的杰出贡献和性别平等倡导工作。Rubin以其在暗物质研究和科学界性别平等方面的成就而闻名
人工智能交互平台Prompts Playground(原名Chat Playground)于3月13日完成重大更新,全面重新设计以优化用户体验。更新引入了实用工具,包括Web搜索和文件搜索,并新增保存与共享功能,以提升提示开发效率和灵活性。此次升级标志着AI工具在提示工程领域的持续进步,增强了其在AI交互市场的竞争力
伴鱼智学发布“AI私教大模型系统”,以其“纳米级知识体系”、“全场景督学服务”和“探究式学习闭环”三大特色,实现教育领域重大突破。该系统基于3000万节课程和7000万用户数据开发,权威认证其新课标理解准确率达到98.5%,在1对1教学场景中超越国际顶尖AI模型,标志着个性化教育时代的到来
谷歌推出升级版AI模型Gemini,引入用户搜索历史以提供个性化答案,由Gemini2.0Flash Thinking模型驱动。此功能注重用户隐私,允许用户自主控制搜索历史链接,并透明地告知答案来源。Gemini的个性化升级预示AI向个性化智能迈进,未来将更深度融入用户生活。此外,谷歌还扩展了Gemini的功能,包括创建私人AI助手军团,增强科研实力,并与多种应用集成,标志着AI个性化时代的来临
最新研究显示,AI搜索引擎在处理新闻信息时存在严重问题,超过60%的新闻查询结果不正确。研究指出,AI模型普遍存在“自信地错误”的倾向,频繁提供错误答案,且引用信息存在误导性。此外,付费服务错误率亦高,对新闻出版商构成挑战。该发现凸显了信息可靠性的担忧
软银集团计划斥资千亿日元,将日本夏普旧工厂改造为先进数据中心,以支持其与OpenAI联合开发的尖端AI智能体运行,标志着日本科技产业在AI领域的重大战略布局
谷歌发布Flash Thinking2.0模型升级,扩展深度研究功能至全体用户,显著增强数据处理能力和用户体验,同时提升报告质量,但系统仍存在一定错误率
OpenAI宣布将人工智能代理Operator的研究预览版扩展至欧洲等地区,目前仅面向Pro用户,计划逐步扩展至其他订阅级别,并集成至ChatGPT平台。此举措标志着OpenAI持续推动其高级AI工具的全球化部署
夏普公司旗下堺显示器产品公司终止LCD面板生产,标志日本大尺寸液晶面板制造时代落幕。软银集团收购夏普大阪堺市旧工厂,投资约1000亿日元建设大型数据中心,与OpenAI合作推动AI商业化。夏普与KDDI签署谅解备忘录,KDDI也将购地建设AI数据中心,共同促进日本AI产业发展
阿里巴巴通义实验室开源了视觉文档理解领域的最新成果ViDoRAG,一种基于多智能体框架的检索增强生成系统。该系统在GPT-4o模型上准确率提升至79.4%,较传统RAG系统提高10%以上,显著优化了视觉文档处理性能,为人工智能在复杂文档理解应用提供了新可能
深圳市科技创新局发布《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》,旨在推进具身智能技术全面发展,构建大模型并提升智能机器人交互、预测和决策能力。计划聚焦重点应用场景,研发垂直应用大模型,并推动AI芯片创新,为智能机器人领域发展提供硬件支撑,助力深圳在科技竞争中取得领先地位
索尼推广的AI生成低质量游戏《超市购物模拟器》引发玩家不满,质疑其内容管理水平。尽管游戏品质低,评分仅为1.53星,销量却超过600份,可能与提供易得的白金奖杯有关。此事件暴露了PlayStation商店内容审核的问题
中信特钢成功接入DeepSeek-R1大模型,推进数字化转型与实体经济融合,旨在提升生产效率、优化决策,并计划扩展至更多业务场景,以实现智能制造和行业升级
通义灵码推出新型推理模型Qwen2.5-Max,具备显著的编程和数学能力,领先于业界其他模型。该模型在多个基准测试中表现出色,被Chatbot Arena评为全球第七名,并在中国非推理类大模型中位居榜首
上海秘塔网络科技有限公司推出AI搜索新功能,新增“视频”搜索模块,实现对多模态数据的扩展,提升用户获取视频资源的效率。该功能基于大量视频内容分析,提供快速定位和学习娱乐视频的能力,并接入DeepSeek R1模型增强智能化搜索体验
QQ浏览器新推出的“AI作文辅导”功能,旨在通过全流程写作技巧辅导,帮助学生提升写作能力,而不仅仅是提供答案。该功能强调培养学生的思考能力,辅助学生立意、提纲、素材选取及范文生成,以提升作文质量
腾讯元宝在苹果中国区App Store免费下载排行榜上跃居首位,领先于DeepSeek。腾讯公司通过增强推广和优化功能,成功提升元宝的下载量和市场影响力
Anthropic完成35亿美元E轮融资,估值飙升至615亿美元,由Lightspeed Venture Partners领投,彰显投资者对AI行业的信心。公司年收入激增,2024年达10亿美元,同比增长十倍。亚马逊和谷歌的战略投资,分别达80亿和30亿美元,支持Anthropic的B2B发展策略
台积电计划未来四年内在美国投资至少1000亿美元,建设新的芯片制造设施,以支持人工智能芯片生产。此举将使台积电在美国的总投资达到约1650亿美元,响应美国政府推动国内半导体生产的需求。该投资对人工智能发展至关重要,并可能与政策优惠挂钩,被视为战略善意的姿态
AMD正式发布Radeon RX9070及RX9070XT显卡,预计3月6日上市,性能较上一代提升20%-40%。新品采用RDNA4架构,支持第三代光线追踪与AI加速器,显著优化游戏与创作体验。两款显卡分别定价549美元和599美元,与NVIDIA RTX570系列竞争激烈。同时,AMD加入开放电信AI平台合作,推动网络基础设施建设
德国电信在MWC大会上宣布推出低于1000美元的AI手机,与Perplexity等公司合作,计划2026年上市,旨在通过AI代理提升用户体验,重塑市场格局
谷歌推出开源AI模型SpeciesNet,用于高效识别野生动物种类,助力生物多样性研究。该模型基于6500万张图像训练,可识别2000多种标签,现已在GitHub上开源,支持商业应用,以加速生物多样性监测工作
在MWC大会上,谷歌宣布Gemini助手将新增实时视频分析和屏幕共享功能,预计Google One AI Premium用户将率先体验。此更新将显著提升AI的视觉互动能力,并率先在Android设备推出。此举标志着谷歌在AI助手领域的关键进展,并加剧了与OpenAI的竞争
MiniMax科技推出首款文本到图像生成模型Image-01,具备精确提示控制、卓越视觉构图及逼真细节表现,提供高效率批量生成,并以极具竞争力的价格服务用户,实现高质量创意图像制作
本研究摘要:华中科技大学、字节跳动及香港大学联合团队开发了一种名为Liquid的新型多模态生成框架,通过采用VQGAN作为图像分词器,实现了图像与文本的统一处理,无需依赖外部视觉模块。实验表明,Liquid在多模态理解、图像生成及文本任务中表现出色,揭示了多模态能力与模型规模的正向关联,为通用多模态智能架构设计提供了新方向
xAI宣布其AI模型Grok-3在Chatbot Arena排行榜上领先,以微弱优势超越GPT4.5-Preview,在多个领域表现出色。这一成就体现了xAI在AI领域的进展,符合创始人马斯克对强大且符合人类价值观AI的追求。尽管Grok-3标记为“preview”,表明可能仍在测试阶段,但其性能已得到显著认可
人工智能初创公司Anthropic完成35亿美元E轮融资,估值达到615亿美元,由光速创投领投,多家知名投资机构参与。此轮融资凸显了市场对Anthropic在AI领域发展潜力的信心,资金将用于加速AI系统研发和全球市场扩张,进一步加剧AI行业的竞争格局
国家网络安全通报中心针对开源跨平台大模型工具Ollama发布安全预警,指出其默认配置存在严重安全漏洞,可能导致未授权访问和数据泄露等风险。清华大学网络空间测绘联合研究中心的分析确认了漏洞的广泛影响,强调了加强用户安全意识与防范措施的重要性。专家建议用户进行全面排查,并及时报告网络攻击迹象,以保障网络安全
百川智能宣布对To B业务进行重大调整,裁撤金融行业B端组,并将PE团队调整至产研组,以集中资源优化金融业务并加速AI医疗技术发展。公司AI医疗项目已取得显著成果,与北京儿童医院合作研发的AI儿科医生投入会诊,标志着全球首个正式应用的AI医生诞生。此举显示百川智能正向聚焦AI医疗的战略转型
Opera 宣布推出 AI 代理“浏览器助手”,实现浏览器功能重大升级,通过自然语言指令提升用户工作效率,并在浏览器内原生运行以保护隐私和提高响应速度
Google recently updated its Gemini app on iOS and iPadOS platforms, introducing six new lock screen widgets designed to enhance user experience by providing quick access to AI assistant features. This
出版商正遭遇人工智能聊天机器人带来的流量危机,数据显示,AI聊天机器人的流量吸收导致出版商网站流量减少了96%。此现象严重威胁出版商广告收入,并可能重塑数字内容行业格局。尽管AI公司承诺合作增加媒体流量,实际情况却相反,引发出版商对互联网生态的担忧
全国人大代表雷军于两会期间提出建议,强调人工智能终端产业高质量发展的重要性,并针对AI换脸拟声技术的违法侵权问题提出治理措施。雷军建议完善人工智能终端标准体系,加强产业协作,提供政策与资金支持,同时呼吁立法进程加速、行业自律及普法宣传,以保障技术进步与公民权益的平衡发展
全国人大代表、小米集团董事长雷军在全国两会上提出五项建议,涉及自动驾驶量产、智能网联新能源汽车产业生态发展、人工智能终端产业高质量发展、新能源汽车号牌设计优化及“AI换脸拟声”违法侵权治理。雷军建议完善人工智能终端标准体系,推动国际国内标准衔接,争取在2027年初步建成,2030年形成全球领先的标准体系
在最新进行的“Elimination Game”基准测试中,AI模型GPT-4.5在“狼人杀”游戏中表现卓越,以62.6%的胜率领先其他AI对手,展现出高级的社交推理和策略能力。测试结果表明,AI在社交智能领域已达到显著水平,预示着未来AI在社交互动中的潜力将不断扩展
Podcastle推出AI文本转语音模型Asyncflow v1.0,提供450种语音,并开放API接口。该模型研发受益于大型语言模型技术进步及1350万美元A轮融资。服务价格具有竞争力,每500分钟约40美元,且语音克隆功能升级,显著提高用户体验
三星宣布Galaxy S25系列在中国市场整合DeepSeek-R1大模型,增强AI功能,提升多模态感知和跨应用执行能力,优化用户沟通体验,标志着三星在AI手机领域的重要进展
在移动世界大会上,亚马逊人工智能通用技术副总裁维沙尔·沙尔玛强调,人工智能已全面融入亚马逊各项业务,包括云计算、机器人技术及消费者产品。亚马逊推出“Bedrock”服务,助力企业灵活应用多种基础模型,并持续投资大型AI计算集群,展现其对计算能力的重视。沙尔玛表示,亚马逊对开放源代码模型的出现持欢迎态度,并坚信客户的选择
火山引擎正式开源其大模型应用,并推出“大模型应用实验室”平台,以促进AI技术生态建设。此举旨在加速开发社区创新,涵盖多种AI工具,获得X平台用户的热烈响应,标志着火山引擎在AI领域的战略转型,有望推动大模型应用落地及行业协作
南洋理工大学研究团队开发的“GaussianCity”技术,实现了3D城市模型生成速度的显著提升(高达60倍),并突破了规模限制,支持无边界的3D城市生成。该技术已被CVPR 2025接收,标志着虚拟现实、自动驾驶和数字孪生领域的重要进展。GaussianCity通过BEV-Point表示方法和空间感知解码器,实现了高效、逼真的城市模型生成,并已全面开源。该技术为多个行业提供了高质量、大规模城市环
全国政协委员、360集团创始人周鸿祎就AI安全议题提出观点,强调应正确看待AI安全,避免夸大或忽视。他指出,不应通过渲染AI不安全来支持垄断,而应抓住AI工业革命机遇,提升生产力。周鸿祎认为AI“幻觉”问题应视为技术挑战,而非单纯安全隐患,呼吁理性对待并寻求针对性解决方案
摘要:DeepBeepMeep团队推出Wan2.1GP模型,为低端GPU用户提供了性能卓越的视频生成解决方案。该模型在基准测试中超越现有开源及商业模型,兼容性强,显存需求低,并支持多任务及中英文文本生成,为视频生成领域带来重要进展
智谱华章科技有限公司发布开源文生图模型CogView4,实现中文生成,成为DPG-Bench基准测试SOTA,遵循Apache2.0协议。模型具有卓越的双语处理和图像生成能力,采用先进技术提升创作效率和图像质量,并计划扩展生态支持
智谱AI开源中文文生图模型CogView4,实现中文图片生成技术突破,具备卓越的中文理解力和生成质量,支持无限制图片尺寸与长文本描述,权威测试中排名第一。模型提供深度定制可能,并计划开放配套工具,为用户提供全面的高质量图像生成解决方案
智谱AI推出开源文生图模型CogView4,具备6亿参数,全面支持中文输入及生成,成为首个在图像中生成汉字的开源模型,显著提升中文内容创作效率。模型采用GLM-4文本编码器,实现中英双语输入,优化动态文本长度处理,并能生成任意分辨率图像,通过多阶段训练流程,提高生成质量和多样性
字节跳动豆包大模型团队与M-A-P开源社区联合发布SuperGPQA,一种包含285个研究生级学科、26,529道问题的知识推理基准测试,填补了长尾学科评估空白。该数据集通过专家-LLM协同机制构建,揭示开源与闭源模型性能差距,指出大语言模型在多领域知识推理上的提升空间
OpenAI的GPT-4.5模型在发布后短时间内成为全任务分类第一名,但随后被马斯克的xAI Grok-3模型反超。两模型票数接近,仅在特定任务上存在差异。尽管GPT-4.5面临初始负面评价,用户对其情商的认可度逐渐上升。人工智能领域竞争激烈,未来智能之战的结果尚不明朗