与#图像识别#相关的内容第4页 - PmDaddy

全部分类数据库前端云计算

使用ML.NET训练一个属于自己的图像分类模型，对图像进行分类就这么简单！

前言今天大姚给大家分享一个.NET开源、免费、跨平台（支持Windows、Linux、macOS多个操作系统）的机器学习框架：ML.NET。并且本文将会带你快速使用ML.NET训练一个属于自己的图像分类模型，对图像进行分类。 ML.NET框架介绍 ML.NET 允许开发人员在其 .NET 应用程序

动手学Avalonia：基于硅基流动构建一个文生图应用（一）

文生图文生图，全称“文字生成图像”（Text-to-Image），是一种AI技术，能够根据给定的文本描述生成相应的图像。这种技术利用深度学习模型，如生成对抗网络（GANs）或变换器（Transformers），来理解和解析文本中的语义信息，并将其转化为视觉表现。文生图可以用于创意设计、图像编辑、虚

用StabilityMatrix一键安装Stable Diffusion

Stable Diffusion是2022年发布的深度学习文字到图像生成模型，它既能免费使用，又能部署在本地端，又有非常多的模型可以直接套用，在使用体验上比Midjourney和DALL-E更加强大。Stable Diffusion使用的模型有下列几大类，对照模型网站 https://civitai

SVG 标签的用法和应用场景

通过使用标签，可以在 SVG 图像内部定义可重复使用的任意图案。这些图案可以通过 fill 属性或 stroke 属性进行引用。使用场景例如我们要在中绘制大量的圆点点，可以通过重复使用标签来实现。

可视化学习：如何使用后期处理通道增强图像效果

GPU是并行渲染的，这样的渲染很高效。但是在实际需求中，有时我们计算片元色值时，需要依赖周围像素点或者某个其他位置像素点的颜色信息，这样的话想要一次性完成绘制就无法做到，需要对纹理进行二次加工处理。

增补博客第七篇 python 比较不同Python图形处理库或图像处理库的异同点

OpenCV、Pillow 和 scikit image OpenCV（OpenCV 是一个强大的计算机视觉库，它提供了各种图像处理和计算机视觉算法的实现，可以处理各种图像和视频数据。异同点跨平台性： OpenCV 支持多种操作系统，包括 Windows、Linux 和 macOS。功能丰富：

深度学习项目-MobileNetV2水果识别模型

本项目旨在研究利用深度学习模型进行水果图像分类的方法，具体包括两个主要任务：一是使用卷积神经网络（CNN）模型进行水果图片的分类，二是探索轻量级神经网络模型MobileNetV2在水果图像分类中的应用。

WebGL实现简易的局部“马赛克”

在Canvas2D中通过调用`drawImage` API就能将图像绘制到画布上，在WebGL中我们也可以绘制图像，在绘制时我们需要用到WebGL中的纹理对象，在之前实现网格背景的视频中，我使用了一个叫做纹理坐标的配置，现在要完成纹理的加载我们也需要用到纹理坐标，并且我们可以通过对纹理坐标处理实现简...

Stable Diffusion中的embedding

嵌入，也称为文本反转，是在 Stable Diffusion 中控制图像样式的另一种方法。在这篇文章中，我们将学习什么是嵌入，在哪里可以找到它们，以及如何使用它们。

Python批量绘制遥感影像数据的直方图

本文介绍基于Python中gdal模块，实现对大量栅格图像批量绘制直方图的方法~

【matplotlib基础】--图例

Matplotlib 中的图例是帮助观察者理解图像数据的重要工具。图例通常包含在图像中，用于解释不同的颜色、形状、标签和其他元素。 1. 主要参数当不设置图例的参数时，默认的图例是这样的。 import numpy as np import matplotlib.pyplot as plt x =

OctConv：八度卷积复现

摘要：不同于传统的卷积，八度卷积主要针对图像的高频信号与低频信号。本文分享自华为云社区《OctConv：八度卷积复现》，作者：李长安。论文解读八度卷积于2019年在论文《Drop an Octave: Reducing Spatial Redundancy in Convolutional

Stable Diffusion AIGC：3步成为P图大师

摘要：instructPix2Pix文字编辑图片是一种纯文本编辑图像的方法，用户提供一张图片和文本编辑指令，告诉模型要做什么，模型根据编辑指令编辑输入的图像，最终输出用户想要的图像。本文分享自华为云社区《【云驻共创】Stable Diffusion AIGC限时0元！3步成为P图大师》，作者：香菜

ComfyUI进阶篇：ControlNet核心节点

前言： ControlNet_aux库包含大量的图片预处理节点，功能丰富，适用于图像分割、边缘检测、姿势检测、深度图处理等多种预处理方式。掌握这些节点的使用是利用ControlNet的关键，本篇文章将帮助您理解和学会使用这些节点。目录一、安装方法二、模型下载三、Segmentor节点四、L

R语言求取大量遥感影像的平均值、标准差：raster库

本文介绍基于R语言中的raster包，批量读取多张栅格图像，对多个栅格图像计算平均值、标准差，并将所得新的栅格结果图像保存的方法~

原来Stable Diffusion是这样工作的

stable diffusion是一种潜在扩散模型，可以从文本生成人工智能图像。为什么叫做潜在扩散模型呢？这是因为与在高维图像空间中操作不同，它首先将图像压缩到潜在空间中，然后再进行操作。在这篇文章中，我们将深入了解它到底是如何工作的,还能够知道文生图的工作方式与图生图的的工作方式有何不同？CFG

T2T-ViT：更多的局部结构信息，更高效的主干网络 | ICCV 2021

论文提出了T2T-ViT模型，引入tokens-to-token（T2T）模块有效地融合图像的结构信息，同时借鉴CNN结果设计了deep-narrow的ViT主干网络，增强特征的丰富性。在ImageNet上从零训练时，T2T-ViT取得了优于ResNets的性能MobileNets性能相当来源：晓

PaliGemma 正式发布 — Google 最新发布的前沿开放视觉语言模型

PaliGemma 是 Google 推出的新一代视觉语言模型家族，能够接收图像与文本输入并生成文本输出。 Google 团队已推出三种类型的模型：预训练（PT）模型、混合模型和微调（FT）模型，这些模型分辨率各异，提供多种精度以便使用。所有模型均在 Hugging Face Hub 的模型库中发

Python批量读取HDF多波段栅格数据并绘制像元直方图

本文介绍基于Python语言gdal模块，实现多波段HDF栅格图像文件的读取、处理与像元值可视化（直方图绘制）等操作~

HDF格式遥感影像批量转为TIFF格式：ArcPy实现

本文介绍基于Python中ArcPy模块，实现大量HDF格式栅格图像文件批量转换为TIFF格式的方法~

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化