图像 - 新火种

首页 > 图像

图像

苹果推出300亿参数MM1多模态大模型，可识别图像推理自然语言

近日，在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中，苹
2024-03-17 18:30
图像合成神器MSG

今天分享一篇被CVPR 2020接收的论文，这篇论文与生成对抗GAN相关，题目为“MSG-GAN: Multi-Scale Gradient GAN for Stable Image Synthesis”（MSG-GAN:用于稳定图像合成的多尺度梯度GAN）。
2023-11-14 15:13
现在，用音频也能指挥GAN生成图像了

CLIP大家都不陌生吧？由OpenAI于今年1月份推出，能够实现文本描述与图片的精准匹配。现在，有人“灵机一动”，从CLIP中学习了一种音频表示方法。用这个方法搭配VQGAN-CLIP，就能实现声音到图像的转变！
2023-09-09 13:01
看GAN如何一步步控制图像生成风格？详解StyleGAN进化过程

GAN 能够有条不紊地控制其生成图像的风格吗？你了解自己的风格吗？大部分 GAN 模型并不了解。那么，GAN 能够有条不紊地控制其生成图像的风格吗？
2024-12-13 12:48
捷安高科：目前已经在部分产品中应用了计算机图像识别、语音识别技术、动作识别技术等相关技术

有投资者在投资者互动平台提问：尊敬的董秘您好：知悉公司拟认定为郑州市人工智能标杆企业，请介绍一下公司是如何在场景应用中使用人工智能的，在AI多模态方面是怎样应用的。　　捷安高科（300845.SZ）12月11日在投资者互动平台表示，公司目前已经在部分产品中应用了计算机图像识别
2023-12-18 18:19
NeurIPS2023|「解释一切」图像概念解释器来了，港科大团队出品

Segment Anything Model（SAM）首次被应用到了基于增强概念的可解释 AI 上。你是否好奇当一个黑盒深度神经网络 (DNN) 预测下图的时候，图中哪个部分对于输出预测为「击球手」的帮助最大？香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。论文：https
2023-10-28 16:15
实测腾讯混元图像2.0模型可毫秒级“边说话边出图”

《科创板日报》5月16日讯（记者张洋洋）AI图像生成进入“毫秒级”时代。今日，腾讯发布最新混元图像2.0模型（Hunyuan Image2.0），该模型即日起在腾讯混元官方网站上线，并对外开放注册体验。根据腾讯方面介绍，相比前代模型，腾讯混元图像2.0模型参数量提升了一个数量级，可实现毫秒级响应，
2025-05-17 11:21
Meta将在其社交平台上标注AI生成图像

7日讯，Meta Platforms的最高政策主管周二表示，该公司将在未来几个月开始使用一套内置在文件中的隐形标记，检测和标记其他公司的人工智能服务生成的图像。
2024-02-07 17:50
人工智能 | 引领未来，掌握图像目标检测：PyTorch带您探索智能时代

PyTorch导言在人工智能的风潮中，图像目标检测技术作为智能视觉的核心，正引领着未来的发展。本文将带您踏上一场人工智能之旅，通过基于PyTorch的图像目标检测，开启您在智能领域的探索之旅。
2023-12-04 10:50
阿里达摩院免费开放100件AI专利许可涵盖图像技术等多个领域

阿里达摩院宣布向社会免费开放100件 AI 专利许可，成为中国人工智能领域规模最大的一次专利开放行动。这些专利涵盖了图像技术、视频技术、3D 视觉等多个领域，其中包括针对癌症精准治疗的专利。
2023-09-01 16:34