
OpenAI 升级 Whisper 语音转录 AI 模型,不牺牲质量速度快 8 倍
OpenAI 在 10 月 1 日举办的 DevDay 活动日中,宣布推出了 Whisper large-v3-turbo 语音转录模型,共有 8.09 亿参数,在质量几乎没有下降的情况下,速度比 large-v3 快 8 倍。
OpenAI 在 10 月 1 日举办的 DevDay 活动日中,宣布推出了 Whisper large-v3-turbo 语音转录模型,共有 8.09 亿参数,在质量几乎没有下降的情况下,速度比 large-v3 快 8 倍。
科技媒体 benzinga 昨日(10 月 2 日)报道,英伟达首席执行官黄仁勋做客是 CNBC 的 Closing Bell Overtime 节目,期间表示公司的下一代 AI 芯片 Blackwell 需求“疯狂”(insane)。
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 Luma AI 升级推出 1.6 版 Dream Machine,AI 视频生成速度快 10 倍。
美国加州州长加文・纽森(Gavin Newsom)今日否决了具有争议的《前沿人工智能模型安全创新法案》(简称 SB 1047),他在否决消息中提到了多个影响他决定的因素,包括该法案对 AI 公司施加的负担、加州在该领域的主导地位以及对该法案可能过于宽泛的批评。
科技媒体 marktechpost 昨日(9 月 27 日)发布博文,报道称 Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式(Embedding)模型。
科技媒体 techradar 今天(9 月 28 日)发布博文,报道称三星 Galaxy AI 项目负责人 YoungJip Kim 表示:“2025 年将是 AI 普及元年,未来 AI 将出现在生活的每个角落”。
科技媒体 The Decoder 昨日(9 月 24 日)发布博文,报道称微软以预览版的形式,在 Azure AI Content Safety 中推出 Groundedness Detection,用于“纠正” AI 幻觉。
在国家智能语音创新中心展区,工作人员现场演示了家电 AI 质检装置和自动化 AI 检测系统。国家智能语音创新中心的工作人员赵一晓介绍说:“空调内机质检首创应用,实现了从‘人耳盲听辨别’到‘机器声纹自动识别’的升级。”该展区模拟了真实的流水线场景,结合声纹、机器视觉和认知等人工智能技术,通过算法实现 AI 质检。
据《华盛顿邮报》报道,美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本,尤其是其对水资源的消耗。研究发现,即使只是生成文本,AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力,进一步凸显了 AI 发展的环境挑战。
OpenAI 传闻中的“草莓”(Strawberry)AI 模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。
科技媒体 MacRumors 昨日(9 月 10 日)报道,苹果 Apple Watch Series 10 智能手表还具备语音隔离功能,能在用户通话过程中让语音更加清晰。
根据在线教育平台Great Learning的一项调查,83%的入门级专业人士表示,技术(尤其是人工智能)“颠覆”,正在影响他们的工作。与此同时,人工智能和机器学习(AI/ML)已经成为2025财年最受员工欢迎的技能提升方向。
世界数字技术院(WDTA)公众号昨日(9 月 6 日)发布博文,宣布其在外滩大会上正式发布了国际标准《大模型供应链安全要求》。
美国司法部近日起诉了一位名为 Michael Smith 的男子,指控他利用机器人及 AI 技术欺骗了Amazon Music、Apple Music、Spotify、YouTube Music 等流媒体平台,非法获取了高达 1000 万美元(IT之家备注:当前约 7092.2 万元人民币)的版税。
科技媒体 testingcatalog 昨日(8 月 30 日)报道,AI 搜索网站 Perplexity 正测试新的内部支付系统 PPLX,在 Discover 信息流中会显示产品卡,提供关于该产品的摘要以及“通过 PPLX 购买”选项。
市场调查机构 Counterpoint Research 昨日(8 月 29 日)发布博文,预测 2024 年全球智能手机出货量将达到 12.3 亿部,同比增长 5%,结束连续 2 年的下降趋势。
科技媒体 MacRumors 昨日(8 月 28 日)发布博文,详细介绍了 iOS / iPadOS 18.1 Beta 3 更新中,为照片(Photos)应用引入的 Clean Up “背景橡皮擦”AI 功能。
今日,美国加州立法机构通过了一项颇具争议的法案 —— 人工智能训练数据透明度法案,该法案将提交给州长加文・纽瑟姆,但其尚未对此法案表态。
一连串进展扎堆:8 月 21 日,Ideogram 正式推出 2.0 版本,声称文本渲染能力更强。 没错,就是那个成立于去年 8 月,由谷歌 AI 绘画 4 大牛集体离职创业的项目,曾获得过一众 AI 大佬投资。 此番 Ideogram 还公开叫板 Flux,官方自信表示其人类评估明显优于 Flux Pro。
Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模型,适用于二维姿势预估、身体部位分割、深度估计和表面法线预测 4 种以人为中心的基本视觉任务。
谷歌公司在今天召开的 Pixel 9 系列手机发布会上,推出名为 Pixel Studio 的全新图像生成应用,并表示将预装在每台 Pixel 9 系列手机上。
彭博社记者马克・古尔曼在最新一期时事通讯中透露,虽然苹果公司计划效仿 iCloud+ 订阅服务的形式,将部分 Apple Intelligence 人工智能功能转变为高达 20 美元(IT之家备注:当前约 143 元人民币) / 月的付费服务,但我们至少在 3 年内不会看到该公司进行相关操作。
路透社今天(8 月 10 日)报道,思科继今年 2 月裁员 4000 人之后,正计划启动第 2 轮裁员,最早可能会在下周三公布第 4 财季(截至 7 月 29 日)中公布。
据CNBC报道,多位分析师预测,苹果公司可能会对其即将推出的高级人工智能功能收取高达20美元的费用,以进一步推动其利润丰厚的服务业务增长。
前段时间冲上热搜的问题「9.11 比 9.9 大吗?」,让几乎所有 LLM 集体翻车。看似热度已过,但 AI 界大佬 Andrej Karpathy 却从中看出了当前大模型技术的本质缺陷,以及未来的潜在改进方向。
OpenAI 公司宣布将于 2024 年 10 月 1 日起,在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动,遗憾的是不会发布新的 AI 前沿模型。
彭博社的马克・古尔曼在最新一期 Power On 实时通讯中透露,虽然苹果公司 Apple Intelligence 大部分 AI 功能已被延迟至 10 月份的 iOS / iPadOS 18.1 正式版,但 iPhone 16 系列手机不会受到影响,依然将在 9 月如期推出。
以色列初创公司 Bzigo 推出了一款名为 Iris 的智能灭蚊设备,这款产品自 2020 年原型问世以来备受关注,如今终于正式上市,售价 339 美元(IT之家备注:当前约 2438 元人民币)。虽然 Iris 能够精准定位蚊虫,但最终的“灭蚊行动”还是要靠人来完成。
根据 CNBC 报道,英国当局已取消价值 13 亿英镑(IT之家备注:当前约 119.38 亿元人民币)的计算基础设施项目,意味着让英国成为世界人工智能领导者的雄心遭受重挫。
彭博社的马克・古尔曼(Mark Gurman)今天透露苹果公司计划将旗下 Apple Intelligence 大部分 AI 功能推迟至 iOS / iPadOS 18.1,相关正式版本最快将在今年 10 月向公众发布。该公司目前正在着力于修复 iOS / iPadOS 18 的 Bug,增强系统稳定性,预计将在 7 月底令 iOS 18.0 趋于稳定。
Apple Intelligence 将支持 iPhone 15 Pro、iPhone 15 Pro Max 及 iPhone 16 系列全部机型;对于搭载 Apple Silicon 芯片的 Mac 和 iPad 平台则将全面提供支持。
不知道小伙伴们有没有遇到过“文章开头、PPT灵感真的好难想”等问题,这时不妨试试AI找灵感。
埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群在单个 RDMA fabric 上使用 10 万张液冷 H100,是“世界上最强大的 AI 训练集群”。
AMD 锐龙 AI 9 HX 375 移动处理器上线官网,NPU 算力由其他 Strix Point 型号的 50 TOPS 提升至 55 TOPS,其余配置和 锐龙 AI 9 HX 370 保持一致。
Meta 今晚发布 Llama 3.1 开源大语言模型,提供 8B、70B 及 405B 参数版本,改进了推理能力及多语言支持,上下文长度提升至 128K。
英特尔 AI Playground 开源软件目前支持在配备 8GB 或更多显存的锐炫 Arc 显卡的系统上运行,未来还将支持英特尔酷睿 Ultra-H 处理器。
如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周 Hugging Face 便公布了“SmolLM”小语言模型家族,其中包含 1.35 亿、3.6 亿及 17 亿参数模型。团队指出他们重点优化了模型所需的 RAM 用量,“即使是在 6GB RAM 的 iPhone 15 上也能运行”。
科技媒体 The Information 今天(7 月 19 日)报道,OpenAI 公司已接触博通(Broadcom)在内的多家芯片设计商,共同探讨研发全新的 AI 芯片
Anthropic 公司于今年 5 月发布 iOS 版本之后,于今天发布了安卓版 Claude 应用,需要安卓 8.0 及更高版本以上设备才能运行。
OpenAI 因涉嫌使用限制性保密协议 (NDA) 限制员工发声而再次受到审查。据《华盛顿邮报》报道,举报人致信美国证券交易委员会,称 OpenAI 强迫员工签署“非法限制性”协议,阻止他们披露公司技术潜在的危害。该举报信指控 OpenAI 违反了美国证券交易委员会的规定,该规定旨在保护员工向联邦当局举报其疑虑的权利并防止报复行为。此前,举报人已于 6 月份正式向美国证券交易委员会提交了投诉。
全球知名投行高盛 (Goldman Sachs) 近期对人工智能 (AI) 投资的回报率提出了质疑。尽管各大企业和投资者正斥资数十亿美元用于人工智能研发,但高盛担忧如此巨额的投入能否真正带来丰厚回报。
据台媒经济日报报道,苹果公司近一个月两度追加 iPhone 16 系列手机备货量,将相关备货量增至 9500 万部,显示对新产品销售充满信心。
婚后,妻子的注意力逐渐转移到孩子身上,让男子突然觉得他们的之间关系,已经失去了浪漫和性吸引力。
路透社今天发布报道,称 OpenAI 公司正在研发代号为“草莓”的全新项目,进一步延伸去年 11 月宣布的 Q* 项目,不断提高 AI 推理能力,让其更接近人类的智力。
科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。
科技媒体 The Verge 昨日报道,谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人,让其能够完成更复杂的任务,且能在复杂的环境下自由穿梭。
英国卫报 7 月 9 日报道,15 名学生因利用 AI 制作并传播女同学的不雅照片,被西班牙地方法院判处 1 年缓刑,此案也引发了关于滥用 Deepfake 技术的广泛讨论。
本次选美比赛冠军由 Kenza Layli 获得,这是设定来自摩洛哥的一位 AI 美女,目前在 Instagram 平台上有超过 20 万粉丝,在 TikTok 上还有 4.5 万粉丝。
钱江晚报·小时新闻 记者 王湛 通讯员 柯溢能 1月16日,浙江大学上海高等研究院在沪举行“计算+AI”赋能科技创新高峰论坛,并成立战略咨询委员会。与会专家通过线上线下方式齐聚一堂,共同探讨“计算+AI”学科交叉下的技术创新、长三角科创共同体构建、创新型人才培养等热点话题,共谋中国人工智能发展创新生态的美好蓝图,助力上海“五个中心”建设。上海市委常委、副市长吴清,浙江大学校长吴朝晖院士分别致辞。上海市政府副秘书长陈鸣波出席,副校长王立忠宣读高研院战略咨询委员会名单。与会领导共同启动“计算+AI”产学研创新生态基地,并为“计算+AI”前沿研究基地和“计算+金融”“计算+生物”“计算+工程”创新实