机器学习图像特征提取:使用Cython的局部二进制模式
ztj100 2024-11-10 13:14 19 浏览 0 评论
介绍
机器学习中特征提取的共同目标是将原始数据表示为一组简化的特征,以便更好地描述其主要特征和属性。通过这种方式,我们可以降低机器学习中原始输入的维数,并使用新特征作为输入来训练模式识别和分类技术。
虽然我们可以从图片中提取出一些特征,但是局部二进制模式(LBP)在理论上是一种简单而有效的灰度和旋转不变纹理分类方法。它们之所以有效,是因为最常见的模式对应于原始的微特征,如边缘、角落、斑点、平坦区域。
Ojala等研究表明,均匀图案的离散发生直方图是一个非常强大的纹理特征。图像纹理是一种二维现象,具有两种特性:(1)空间结构(图案)和(2)对比度。
方法
Circularly Symmetric Neighbor Set
对于给定的像素gc,Circularly Symmetric Neighbor Set是由在半径为R的圆上围绕中心点的坐标点(i, j)和一些元素P定义的。
纹理
我们将纹理T定义为灰度图像中的像素集合
其中gp对应于p局部邻域的灰度值。
插值
当邻域不在像素的中心时,应该通过插值计算该邻域灰度值。因此,我们需要定义一个给定坐标的函数,返回插值的灰度值。
实现灰度不变性
考虑到可能的信息丢失,可以将纹理转换为joint difference。为了计算它,我们将中心像素的灰度值减去所有的neighbor set。联合差分分布是一种高度区分的纹理算子。它记录了在p维直方图中每个像素附近出现的各种图案。
其中gp是p相邻的灰色值。这种分布对于灰度变化是不变的。
局部二进制模式
根据定义,LBP_ {P,R}运算符对于灰度的任何单调变换是不变的。只要灰度值的顺序保持不变,LBP_ {P,R}运算符的输出保持不变。
其中
Uniform 局部二进制模式
Ojala提到,在他们的实践经验中,LBP不是一个好的判别器。他们建议只选择一组局部二进制模式,使空间过渡的数量(按位0/1变化)不超过2.例如,模式'1111'有0个空间过渡,模式'1100'有1个空间过渡和模式'1101'具有2个空间过渡。对于每个统一模式,关联唯一索引。
现在,我们可以计算中心像素的局部二进制模式。下一步是计算所有像素的局部二进制模式。
提示:为简单起见,我不考虑所选索引为负的情况(即img_gray [-1] [0]返回第一列的最后一个像素)。如果我们想要更准确的计算,我们应该考虑这个案例并对其进行处理。
Cython代码
在本例中,我们将使用Cython。代码在下一张图片中显示,它是一大块代码。它的某些部分可以改进,但速度已经快得多。
代码的编写方式使得大部分代码完全在C API中运行。这种策略大大加快了执行速度,但也让我们可以利用Cython的并行模块。我们将在CPU中的多个核心之间拆分作业。
from libc.math cimport sin, cos, pi, ceil, floor, pow from libc.stdlib cimport abort, malloc, free import numpy as np cimport numpy as np cimport cython from cython.parallel import prange, parallel cimport openmp cdef double get_pixel2d( double *image, Py_ssize_t n_rows, Py_ssize_t n_cols, long x, long y) nogil: if (y < 0) or (y >= n_rows) or (x < 0) or (x >= n_cols): return 0 else: return image[y * n_cols + x] cdef double bilinear_interpolation( double *image, Py_ssize_t n_rows, Py_ssize_t n_cols, double x, double y) nogil: cdef double d_y, d_x, top_left, top_right, bottom_left, bottom_right cdef long min_y, min_x, max_y, max_x min_y = <long>floor(y) min_x = <long>floor(x) max_y = <long>ceil(y) max_x = <long>ceil(x) d_y = y - min_y d_x = x - min_x top_left = get_pixel2d(image, n_rows, n_cols, min_x, min_y) top_right = get_pixel2d(image, n_rows, n_cols, max_x, min_y) bottom_left = get_pixel2d(image, n_rows, n_cols, min_x, max_y) bottom_right = get_pixel2d(image, n_rows, n_cols, max_x, max_y) top = (1 - d_x) * top_left + d_x * top_right bottom = (1 - d_x) * bottom_left + d_x * bottom_right return (1 - d_y) * top + d_y * bottom cdef double *joint_difference_distribution( double *image, Py_ssize_t n_rows, Py_ssize_t n_cols, int x0, int y0, int P, int R ) nogil: cdef Py_ssize_t p cdef double *T = <double *> malloc(sizeof(double) * P) cdef double x, y, gp, gc if T is NULL: abort() gc = get_pixel2d(image, n_rows, n_cols, x0, y0) for p in range(P): x = x0 + R * cos(2 * pi * p / P) y = y0 - R * sin(2 * pi * p / P) gp = bilinear_interpolation(image, n_rows, n_cols, x, y) T[p] = gp - gc return T cdef int *binary_joint_distribution(double *T, Py_ssize_t T_size) nogil: cdef int *s_T = <int *> malloc(sizeof(int) * T_size) cdef Py_ssize_t i = 0 for t in range(T_size): if T[t] >= 0.0: s_T[t] = 1 else: s_T[t] = 0 return s_T cdef long LBP(double *T, int *s_T, Py_ssize_t T_size) nogil: cdef long LBP_pr = 0 cdef Py_ssize_t i = 0 for i in range(0, T_size): LBP_pr = LBP_pr + 2 ** i * s_T[i] return LBP_pr cdef int is_uniform_pattern(int *s_T, Py_ssize_t s_T_size) nogil: cdef Py_ssize_t i = 0 cdef int counter = 0 for i in range(s_T_size - 1): if s_T[i] != s_T[i + 1]: counter += 1 if counter > 2: return 0 return 1 cdef int create_index(int *s_T, Py_ssize_t s_T_size) nogil: cdef int n_ones = 0 cdef int rot_index = -1 cdef int first_one = -1 cdef int first_zero = -1 cdef int lbp = -1 cdef Py_ssize_t i for i in range(s_T_size): if s_T[i]: n_ones += 1 if first_one == -1: first_one = i else: if first_zero == -1: first_zero = i if n_ones == 0: lbp = 0 elif n_ones == s_T_size: lbp = s_T_size * (s_T_size - 1) + 1 else: if first_one == 0: rot_index = n_ones - first_zero else: rot_index = s_T_size - first_one lbp = 1 + (n_ones - 1) * s_T_size + rot_index return lbp cdef int LBP_uniform(int *s_T, Py_ssize_t s_T_size) nogil: cdef int LBP_pru = 0 cdef Py_ssize_t i = 0 if is_uniform_pattern(s_T, s_T_size): LBP_pru = create_index(s_T, s_T_size) else: LBP_pru = 2 + s_T_size * (s_T_size - 1) return LBP_pru @cython.boundscheck(False) @cython.wraparound(False) def local_binary_patterns( double[:, ::1] image, int P, int R, int num_threads=1 ): cdef Py_ssize_t x = 0 cdef Py_ssize_t y = 0 cdef int n_rows = image.shape[0] cdef int n_cols = image.shape[1] cdef int[:, ::1] lbp = np.zeros([n_rows, n_cols], dtype=np.int32) with nogil, parallel(num_threads=num_threads): for y in prange(n_rows, schedule='static'): for x in prange(n_cols, schedule='static'): T = joint_difference_distribution(&image[0][0], n_rows, n_cols, x, y, P, R) s_T = binary_joint_distribution(T, P) lbp[y, x] = LBP_uniform(s_T, P) return np.asarray(lbp)
使用4个线程,我们可以在不到150毫秒的时间内计算所有像素的局部二进制模式。
与相似图像的比较
让我们拍摄另一张砖块图片,但这张图片会有不同的纹理。
两个直方图非常相似,它们应该是,最后它们都是砖块。尽管如此,20到40的特征在两个图像中都非常不同。这意味着通过良好的机器学习算法,我们可以正确地对它们进行分类。
结论
局部二进制模式是简单但有效的机器学习特征。背后的理论并不难理解,并且易于编码。然而,如果我们完全使用Python编写代码,我们将遇到一些性能问题。我们用Cython解决了这个问题,结果非常令人印象深刻。
相关推荐
- 这个 JavaScript Api 已被废弃!请慎用!
-
在开发过程中,我们可能会不自觉地使用一些已经被标记为废弃的JavaScriptAPI。这些...
- JavaScript中10个“过时”的API,你的代码里还在用吗?
-
JavaScript作为一门不断发展的语言,其API也在持续进化。新的、更安全、更高效的API不断涌现,而一些旧的API则因为各种原因(如安全问题、性能瓶颈、设计缺陷或有了更好的替代品)被标记为“废...
- 几大开源免费的 JavaScript 富文本编辑器测评
-
MarkDown编辑器用的时间长了,发现发现富文本编辑器用起来是真的舒服。...
- 比较好的网页里面的 html 编辑器 推荐
-
如果您正在寻找嵌入到网页中的HTML编辑器,以便用户可以直接在网页上编辑HTML内容,以下是几个备受推荐的:CKEditor:CKEditor是一个功能强大的、开源的富文本编辑器,可以嵌入到...
- Luckysheet 实现excel多人在线协同编辑
-
前言前些天看到Luckysheet支持协同编辑Excel,正符合我们协同项目的一部分,故而想进一步完善协同文章,但是遇到了一下困难,特此做声明哈,若侵权,请联系我删除文章!若侵犯版权、个人隐私,请联系...
- 从 Element UI 源码的构建流程来看前端 UI 库设计
-
作者:前端森林转发链接:https://mp.weixin.qq.com/s/ziDMLDJcvx07aM6xoEyWHQ引言...
- 手把手教你如何用 Decorator 装饰你的 Typescript?「实践」
-
作者:Nealyang转发连接:https://mp.weixin.qq.com/s/PFgc8xD7gT40-9qXNTpk7A...
- 推荐五个优秀的富文本编辑器
-
富文本编辑器是一种可嵌入浏览器网页中,所见即所得的文本编辑器。对于许多从事前端开发的小伙伴来说并不算陌生,它的应用场景非常广泛,平时发个评论、写篇博客文章等都能见到它的身影。...
- 基于vue + element的后台管理系统解决方案
-
作者:林鑫转发链接:https://github.com/lin-xin前言该方案作为一套多功能的后台框架模板,适用于绝大部分的后台管理系统(WebManagementSystem)开发。基于v...
- 开源富文本编辑器Quill 2.0重磅发布
-
开源富文本编辑器Quill正式发布2.0版本。官方TypeScript声明...
- Python之Web开发框架学习 Django-表单处理
-
在Django中创建表单实际上类似于创建模型。同样,我们只需要从Django类继承,则类属性将是表单字段。让我们在myapp文件夹中添加一个forms.py文件以包含我们的应用程序表单。我们将创建一个...
- Django测试入门:打造坚实代码基础的钥匙
-
这一篇说一下django框架的自动化测试,...
- Django ORM vs SQLAlchemy:到底谁更香?从入门到上头的选择指南
-
阅读文章前辛苦您点下“关注”,方便讨论和分享,为了回馈您的支持,我将每日更新优质内容。...
- 超详细的Django 框架介绍,它来了!
-
时光荏苒,一晃小编的Tornado框架系列也结束了。这个框架虽然没有之前的FastAPI高流量,但是,它也是小编的心血呀。总共16篇博文,从入门到进阶,包含了框架的方方面面。虽然小编有些方面介绍得不是...
- 20《Nginx 入门教程》使用 Nginx 部署 Python 项目
-
今天的目标是完成一个PythonWeb项目的线上部署,我们使用最新的Django项目搭建一个简易的Web工程,然后基于Nginx服务部署该PythonWeb项目。1.前期准备...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)