图像视觉 - 搜索 News

1 小时

RobotSense: 智体科技开创视觉-语言-动作协同的Robotaxi决策新范式

正如DeepSeek凭借出乎意料的高性能、低成本和开放源代码策略，迅速引爆全球市场、震撼美股科技板块，并引来业内大佬连连赞叹，其技术突破正预示着全球AI竞争格局的深刻变革。这场风暴不仅证明了中国在人工智能领域拥有颠覆性潜力，更显示出在资源受限的情况 ...

4 天

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

LLaVA-Mini 是一个统一的多模态大模型，能够高效地支持图像、高分辨率图像和视频的理解。LLaVA-Mini 在图像和视频理解方面表现出色，同时在计算效率、推理延迟和内存使用上具有优势，促进了高效 LMM 的实时多模态交互。

1 天

惊艳发布：MOWA多合一图像扭曲模型引领视觉处理新时代

总的来说，MOWA的发布不仅展示了图像处理技术的新时代，也为市场带来了激烈的竞争。在快速发展的科技浪潮中，紧跟技术创新步伐，将是所有相关从业者面临的重要课题。对于普通消费者而言，了解这些新兴技术将有助于做出更理性的购买决策，同时也能享受到技术进步所带来的便利。未来，期待MOWA带来更多的惊喜！返回搜狐，查看更多 ...

3 天

DeepSeek开源Janus-Pro-7B：多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注，位居应用商店排行榜首位并改变了股市。随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B，该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 ...

2 天

观视天地：钟扬引领计算机视觉领域进步

观视天地：钟扬引领计算机视觉领域进步,计算机视觉,钟扬,人工智能,算法,计算机 ...

16 天

小米专利申请：全新图像处理技术优化降噪视觉体验

随着人工智能技术的发展，图像处理领域正在经历显著的变革。AI算法的引入使得降噪、图像增强及风格转化等操作变得更加智能化与高效化。小米的此项专利，恰恰是在这一趋势下，对降噪处理和视觉效果的一次深刻研究与实践，为未来更多的应用场景打下基础。图像质量优化的 ...

4 天

视觉技术考研，如何挑选最适合的方向？

-简介：该方向主要关注如何通过算法和技术手段改善或变换数字图像的质量，并从中提取有用信息进行分类或识别。传统的方法包括滤波器设计、边缘检测、形态学操作等；现代则更多结合深度学习来进行高效的特征表示。

2 天on MSN

GitHub Copilot 推出视觉功能：图片可秒变代码

IT之家 2 月 8 日消息，GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更新，并展示了 Copilot 未来更具自主性的愿景。此次更新中最引人注目的功能之一是 Copilot ...

16 天

突破性专利！北京龙智数科如何提升图像处理的语义能力

龙智数科的这一专利技术，相较于传统的图像处理方法，具有明显的技术优势。通过引入注意力机制和视觉变换技术，其处理结果不仅在准确性上得到提升，而且对于图像的深层语义信息提取能力也显著增强。

来自MSN1 个月

DeepSeek-VL2开源，AI视觉模型新突破：MoE架构引领新潮流！

这些改进使得 DeepSeek-VL2 在处理复杂视觉任务时更加游刃有余。在架构方面，DeepSeek-VL2 采用了创新的切图策略，支持动态分辨率图像。这一策略通过 ...

14 天on MSN

Hugging Face发布SmolVLM系列：小巧而强大的视觉语言模型登场

近日，Hugging Face 推出了两款创新的多模态模型——SmolVLM-256M和SmolVLM-500M，这两款模型在视觉与语言处理领域引起了广泛关注。其中，SmolVLM-256M更是被誉为全球最小的视觉语言模型，这一突破性的成就令人瞩目。据了解，这两款模型均源自Hugging ...

爱范儿12 天

阿里云发布视觉模型 Qwen2.5-VL

新的 Qwen2.5-VL 能够更准确地解析图像内容，突破性地支持超 1 小时的视频理解，无需微调就可变身为一个能操控手机和电脑的 AI 视觉智能体（Visual Agents），实现 …… ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果