百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

机器学习图像特征提取:使用Cython的局部二进制模式

ztj100 2024-11-10 13:14 11 浏览 0 评论

介绍

机器学习中特征提取的共同目标是将原始数据表示为一组简化的特征,以便更好地描述其主要特征和属性。通过这种方式,我们可以降低机器学习中原始输入的维数,并使用新特征作为输入来训练模式识别和分类技术。

虽然我们可以从图片中提取出一些特征,但是局部二进制模式(LBP)在理论上是一种简单而有效的灰度和旋转不变纹理分类方法。它们之所以有效,是因为最常见的模式对应于原始的微特征,如边缘、角落、斑点、平坦区域。

Ojala等研究表明,均匀图案的离散发生直方图是一个非常强大的纹理特征。图像纹理是一种二维现象,具有两种特性:(1)空间结构(图案)和(2)对比度。

方法

Circularly Symmetric Neighbor Set

对于给定的像素gc,Circularly Symmetric Neighbor Set是由在半径为R的圆上围绕中心点的坐标点(i, j)和一些元素P定义的。

纹理

我们将纹理T定义为灰度图像中的像素集合

其中gp对应于p局部邻域的灰度值。

插值

当邻域不在像素的中心时,应该通过插值计算该邻域灰度值。因此,我们需要定义一个给定坐标的函数,返回插值的灰度值。

实现灰度不变性

考虑到可能的信息丢失,可以将纹理转换为joint difference。为了计算它,我们将中心像素的灰度值减去所有的neighbor set。联合差分分布是一种高度区分的纹理算子。它记录了在p维直方图中每个像素附近出现的各种图案。

其中gp是p相邻的灰色值。这种分布对于灰度变化是不变的。

局部二进制模式

根据定义,LBP_ {P,R}运算符对于灰度的任何单调变换是不变的。只要灰度值的顺序保持不变,LBP_ {P,R}运算符的输出保持不变。

其中

Uniform 局部二进制模式

Ojala提到,在他们的实践经验中,LBP不是一个好的判别器。他们建议只选择一组局部二进制模式,使空间过渡的数量(按位0/1变化)不超过2.例如,模式'1111'有0个空间过渡,模式'1100'有1个空间过渡和模式'1101'具有2个空间过渡。对于每个统一模式,关联唯一索引。

现在,我们可以计算中心像素的局部二进制模式。下一步是计算所有像素的局部二进制模式。

提示:为简单起见,我不考虑所选索引为负的情况(即img_gray [-1] [0]返回第一列的最后一个像素)。如果我们想要更准确的计算,我们应该考虑这个案例并对其进行处理。

Cython代码

在本例中,我们将使用Cython。代码在下一张图片中显示,它是一大块代码。它的某些部分可以改进,但速度已经快得多。

代码的编写方式使得大部分代码完全在C API中运行。这种策略大大加快了执行速度,但也让我们可以利用Cython的并行模块。我们将在CPU中的多个核心之间拆分作业。

from libc.math cimport sin, cos, pi, ceil, floor, pow
from libc.stdlib cimport abort, malloc, free
import numpy as np
cimport numpy as np
cimport cython
from cython.parallel import prange, parallel
cimport openmp
 
 
cdef double get_pixel2d(
 double *image,
 Py_ssize_t n_rows, 
 Py_ssize_t n_cols,
 long x,
 long y) nogil:
 
 if (y < 0) or (y >= n_rows) or (x < 0) or (x >= n_cols):
 return 0
 else:
 return image[y * n_cols + x]
 
 
cdef double bilinear_interpolation(
 double *image,
 Py_ssize_t n_rows,
 Py_ssize_t n_cols,
 double x,
 double y) nogil:
 
 cdef double d_y, d_x, top_left, top_right, bottom_left, bottom_right
 cdef long min_y, min_x, max_y, max_x
 
 min_y = <long>floor(y)
 min_x = <long>floor(x)
 max_y = <long>ceil(y)
 max_x = <long>ceil(x)
 
 d_y = y - min_y
 d_x = x - min_x
 
 top_left = get_pixel2d(image, n_rows, n_cols, min_x, min_y)
 top_right = get_pixel2d(image, n_rows, n_cols, max_x, min_y)
 bottom_left = get_pixel2d(image, n_rows, n_cols, min_x, max_y)
 bottom_right = get_pixel2d(image, n_rows, n_cols, max_x, max_y)
 
 top = (1 - d_x) * top_left + d_x * top_right
 bottom = (1 - d_x) * bottom_left + d_x * bottom_right
 
 return (1 - d_y) * top + d_y * bottom
 
 
cdef double *joint_difference_distribution(
 double *image,
 Py_ssize_t n_rows,
 Py_ssize_t n_cols,
 int x0,
 int y0,
 int P,
 int R
) nogil:
 cdef Py_ssize_t p
 cdef double *T = <double *> malloc(sizeof(double) * P)
 cdef double x, y, gp, gc
 
 if T is NULL:
 abort()
 
 gc = get_pixel2d(image, n_rows, n_cols, x0, y0)
 
 for p in range(P):
 x = x0 + R * cos(2 * pi * p / P)
 y = y0 - R * sin(2 * pi * p / P)
 gp = bilinear_interpolation(image, n_rows, n_cols, x, y)
 T[p] = gp - gc
 
 return T
 
 
cdef int *binary_joint_distribution(double *T, Py_ssize_t T_size) nogil:
 cdef int *s_T = <int *> malloc(sizeof(int) * T_size)
 cdef Py_ssize_t i = 0
 
 for t in range(T_size):
 if T[t] >= 0.0:
 s_T[t] = 1
 else:
 s_T[t] = 0
 
 return s_T
 
 
cdef long LBP(double *T, int *s_T, Py_ssize_t T_size) nogil:
 cdef long LBP_pr = 0
 cdef Py_ssize_t i = 0
 
 for i in range(0, T_size):
 LBP_pr = LBP_pr + 2 ** i * s_T[i]
 
 return LBP_pr
 
 
cdef int is_uniform_pattern(int *s_T, Py_ssize_t s_T_size) nogil:
 cdef Py_ssize_t i = 0
 cdef int counter = 0
 
 for i in range(s_T_size - 1):
 if s_T[i] != s_T[i + 1]:
 counter += 1
 
 if counter > 2:
 return 0
 return 1
 
 
cdef int create_index(int *s_T, Py_ssize_t s_T_size) nogil:
 cdef int n_ones = 0
 cdef int rot_index = -1
 cdef int first_one = -1
 cdef int first_zero = -1
 cdef int lbp = -1
 
 cdef Py_ssize_t i
 for i in range(s_T_size):
 if s_T[i]:
 n_ones += 1
 if first_one == -1:
 first_one = i
 else:
 if first_zero == -1:
 first_zero = i
 
 if n_ones == 0:
 lbp = 0
 elif n_ones == s_T_size:
 lbp = s_T_size * (s_T_size - 1) + 1
 else:
 if first_one == 0:
 rot_index = n_ones - first_zero
 else:
 rot_index = s_T_size - first_one
 lbp = 1 + (n_ones - 1) * s_T_size + rot_index
 return lbp
 
 
cdef int LBP_uniform(int *s_T, Py_ssize_t s_T_size) nogil:
 cdef int LBP_pru = 0
 cdef Py_ssize_t i = 0
 
 if is_uniform_pattern(s_T, s_T_size):
 LBP_pru = create_index(s_T, s_T_size)
 else:
 LBP_pru = 2 + s_T_size * (s_T_size - 1)
 
 return LBP_pru
 
 
@cython.boundscheck(False)
@cython.wraparound(False)
def local_binary_patterns(
 double[:, ::1] image,
 int P,
 int R,
 int num_threads=1
):
 
 cdef Py_ssize_t x = 0
 cdef Py_ssize_t y = 0
 cdef int n_rows = image.shape[0]
 cdef int n_cols = image.shape[1]
 cdef int[:, ::1] lbp = np.zeros([n_rows, n_cols], dtype=np.int32) 
 
 with nogil, parallel(num_threads=num_threads):
 for y in prange(n_rows, schedule='static'):
 for x in prange(n_cols, schedule='static'):
 T = joint_difference_distribution(&image[0][0], n_rows, n_cols, x, y, P, R)
 s_T = binary_joint_distribution(T, P)
 lbp[y, x] = LBP_uniform(s_T, P)
 
 return np.asarray(lbp)

使用4个线程,我们可以在不到150毫秒的时间内计算所有像素的局部二进制模式。

与相似图像的比较

让我们拍摄另一张砖块图片,但这张图片会有不同的纹理。

两个直方图非常相似,它们应该是,最后它们都是砖块。尽管如此,20到40的特征在两个图像中都非常不同。这意味着通过良好的机器学习算法,我们可以正确地对它们进行分类。

结论

局部二进制模式是简单但有效的机器学习特征。背后的理论并不难理解,并且易于编码。然而,如果我们完全使用Python编写代码,我们将遇到一些性能问题。我们用Cython解决了这个问题,结果非常令人印象深刻。

相关推荐

Vue 技术栈(全家桶)(vue technology)

Vue技术栈(全家桶)尚硅谷前端研究院第1章:Vue核心Vue简介官网英文官网:https://vuejs.org/中文官网:https://cn.vuejs.org/...

vue 基础- nextTick 的使用场景(vue的nexttick这个方法有什么用)

前言《vue基础》系列是再次回炉vue记的笔记,除了官网那部分知识点外,还会加入自己的一些理解。(里面会有部分和官网相同的文案,有经验的同学择感兴趣的阅读)在开发时,是不是遇到过这样的场景,响应...

vue3 组件初始化流程(vue组件初始化顺序)

学习完成响应式系统后,咋们来看看vue3组件的初始化流程既然是看vue组件的初始化流程,咋们先来创建基本的代码,跑跑流程(在app.vue中写入以下内容,来跑流程)...

vue3优雅的设置element-plus的table自动滚动到底部

场景我是需要在table最后添加一行数据,然后把滚动条滚动到最后。查网上的解决方案都是读取html结构,暴力的去获取,虽能解决问题,但是不喜欢这种打补丁的解决方案,我想着官方应该有相关的定义,于是就去...

Vue3为什么推荐使用ref而不是reactive

为什么推荐使用ref而不是reactivereactive本身具有很大局限性导致使用过程需要额外注意,如果忽视这些问题将对开发造成不小的麻烦;ref更像是vue2时代optionapi的data的替...

9、echarts 在 vue 中怎么引用?(必会)

首先我们初始化一个vue项目,执行vueinitwebpackechart,接着我们进入初始化的项目下。安装echarts,npminstallecharts-S//或...

无所不能,将 Vue 渲染到嵌入式液晶屏

该文章转载自公众号@前端时刻,https://mp.weixin.qq.com/s/WDHW36zhfNFVFVv4jO2vrA前言...

vue-element-admin 增删改查(五)(vue-element-admin怎么用)

此篇幅比较长,涉及到的小知识点也比较多,一定要耐心看完,记住学东西没有耐心可不行!!!一、添加和修改注:添加和编辑用到了同一个组件,也就是此篇文章你能学会如何封装组件及引用组件;第二能学会async和...

最全的 Vue 面试题+详解答案(vue面试题知识点大全)

前言本文整理了...

基于 vue3.0 桌面端朋友圈/登录验证+60s倒计时

今天给大家分享的是Vue3聊天实例中的朋友圈的实现及登录验证和倒计时操作。先上效果图这个是最新开发的vue3.x网页端聊天项目中的朋友圈模块。用到了ElementPlus...

不来看看这些 VUE 的生命周期钩子函数?| 原力计划

作者|huangfuyk责编|王晓曼出品|CSDN博客VUE的生命周期钩子函数:就是指在一个组件从创建到销毁的过程自动执行的函数,包含组件的变化。可以分为:创建、挂载、更新、销毁四个模块...

Vue3.5正式上线,父传子props用法更丝滑简洁

前言Vue3.5在2024-09-03正式上线,目前在Vue官网显最新版本已经是Vue3.5,其中主要包含了几个小改动,我留意到日常最常用的改动就是props了,肯定是用Vue3的人必用的,所以针对性...

Vue 3 生命周期完整指南(vue生命周期及使用)

Vue2和Vue3中的生命周期钩子的工作方式非常相似,我们仍然可以访问相同的钩子,也希望将它们能用于相同的场景。...

救命!这 10 个 Vue3 技巧藏太深了!性能翻倍 + 摸鱼神器全揭秘

前端打工人集合!是不是经常遇到这些崩溃瞬间:Vue3项目越写越卡,组件通信像走迷宫,复杂逻辑写得脑壳疼?别慌!作为在一线摸爬滚打多年的老前端,今天直接甩出10个超实用的Vue3实战技巧,手把...

怎么在 vue 中使用 form 清除校验状态?

在Vue中使用表单验证时,经常需要清除表单的校验状态。下面我将介绍一些方法来清除表单的校验状态。1.使用this.$refs...

取消回复欢迎 发表评论: