平安科技前沿技术部门负责人王磊:大规模预训练模型在垂直领域应用的缺陷与改进
作者 | 王磊整理 |维克多编辑 | 青暮目前,大规模预训练模型已经在自然语言处理领域取得了巨大的成功。BERT、GPT-3等大规模预训练模型被看做是“暴力美学”的一次胜利,验证了“模型越大,性能越好”的逻辑,业界也普遍形成了“炼大模型”的竞赛趋势,国内研究机构和企业也相继发布了大规模预训练模型,呈
作者 | 王磊整理 |维克多编辑 | 青暮目前,大规模预训练模型已经在自然语言处理领域取得了巨大的成功。BERT、GPT-3等大规模预训练模型被看做是“暴力美学”的一次胜利,验证了“模型越大,性能越好”的逻辑,业界也普遍形成了“炼大模型”的竞赛趋势,国内研究机构和企业也相继发布了大规模预训练模型,呈
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfen
昨天 瑞士信息与通信科技公司EthonAI研发AI驱动的质量管理平台,帮助制造业减少50%的质量缺陷。
北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式,相比传统模型在多项任务中表现出色,同时降低了参数量和计算量,增强了对周期性特征的建模能力,应用潜力广泛。周期性现象广泛存在,深刻影响着人类社会和自然科学。作为最重要的基本特性之一,许多规律都显式或隐式地包含周期性,例如,天文学中的行星运动
瑞士连续12年全球创新指数竞争力排名第一,是全球重要的创新策源地,也是中国首个创新战略伙伴关系国,在创新发展和科技金融领域与中国具有极佳互补性。由Venturelab主办的“瑞士创新100强”,汇聚了最佳“瑞士制造”的初创及成长期科技创新企业,
俄罗斯托木斯克理工大学开发出一种利用神经网络技术检测半透明材料缺陷的新方法,测量精度超过所有其他方法。相关研究结果发表在最近的《无损评估》上。玻璃纤维是一种由多种成分组成的复合材料,由于其良好的抗拉强
在数字化与智能化高速发展的当下,制造业正经历前所未有的变革。以人工智能(AI)为核心的智能制造技术,正在为传统制造业注入新的活力,促使其朝着更高效、精准和智能的方向发展。在这场深刻的变革中,“零缺陷”已不再是遥不可及的梦想,而是制造业的重要追求目标。AI技术以其独特的优势,正在开启智能制造的新篇
华为盘古系列,带来架构层面上新!新火种获悉,华为诺亚方舟实验室等联合推出新型大语言模型架构:盘古-π。它通过增强非线性,在传统Transformer架构上做出改进,由此可以显著降低特征塌陷问题。
强化学习【作者】彭海青(北京理工大学法学院教授、《北理法学》执行主编);于坤(北京理工大学法学院硕士研究生)【来源】北大法宝法学期刊库《数据法学》2023年第1期(文末附本期期刊目录)。因篇幅较长,已略去原文注释。内容提要:人工智能技术在司法实践中广泛应用,对于检察机关提出量刑建议而言尤为重要。检察
12月24日消息,据报道,芯片顾问机构Semianalysis经过5个月的调查后指出,AMD最新"MI300X" AI芯片因软件缺陷和性能未达预期,难以挑战NVIDIA的市场领导地位。Semianalysis的报告指出,AMD软件存在缺陷,若未经过大量调试,训练AI模型几乎不可能