深度学习用于工业参数优化（基于深度学习的单通道语音增强）

Mike • 2022-11-19 • 资讯 • 阅读 362

本文代码请见： https://github.com/Ryuk17/SpeechAlgorithms

作者:凌逆战

博客地址（转载请指明出处）： https://www.cnblogs.com/LXP-Never/p/14142108.html

传统的语音增强方法基于一些设定好的先验假设，但是这些先验假设存在一定的不合理之处。此外传统语音增强依赖于参数的设定，人工经验等。随着深度学习的发展，越来越多的人开始注意使用深度学习来解决语音增强问题。由于单通道使用场景较多，本文就以单通道语音增强为例。

目前基于深度神经网络单通道语音增强方法大致可以分为两类：

第一种基于映射的方法 第二种基于 mask 的方法

基于映射的语音增强

基于映射的语音增强方法通过训练神经网络模型直接学习带噪语音和纯净语音之间的映射关系，有两种映射方案：

频谱映射 ：使用模型预测语音的时频域表示，之后再将语音的时频域表示通过波形合成技术恢复成时域信号。使用最多的时频域表示特征是短时傅里叶变换谱，利用人耳对相位不敏感的特性，一般只预测短时傅里叶变换幅度谱，并使用混合语音的相位合成预测语音的波形。

波形映射 ：直接将带噪语音波形输入到模型，模型直接输出纯净语音波形的方法。

我们以频谱映射举例说明一下：

训练阶段

输入：这里采用较为简单地特征，即 带噪声语音信号的幅度谱 ，也可以采用其他的特征。值得一提的是，如果你的输入是一帧，对应输出也是一帧的话效果一般不会很好。因此一般采用扩帧的技术，如下图所示，即每次输入除了当前帧外还需要输入当前帧的前几帧和后几帧。这是因为语音具有短时相关性，对输入几帧是为了更好的学习这种相关性

Label： 数据的 label为纯净语音信号的幅度谱 ，这里只需要一帧就够了。 损失函数： 学习噪声幅度谱与纯净语音信号的幅度谱类似于一个回归问题，因此损失函数采用回归常用的损失函数，如均方误差（MSE）、均方根误差（RMSE）或平均绝对值误差（MAE）等…. 最后一层的激活函数 ：由于是回归问题，最后一层采用线性激活函数其他：输入的幅度谱进行 归一化 可以加速学习过程和更好的收敛。如果不采用幅度谱可以采用功率谱，要注意的是功率谱如果采用的单位是dB，需要对数据进行预处理，因为log的定义域不能为0，简单的方法就是在取对数前给等于0的功率谱加上一个非常小的数

增强阶段

输入： 输入为噪声信号的幅度谱，这里同样需要扩帧。对输入数据进行处理可以在语音信号加上值为0的语音帧，或者舍弃首尾的几帧。如果训练过程对输入进行了归一化，那么这里同样需要进行归一化 输出： 输入为估计的纯净语音幅度谱 重构波形： 在计算输入信号幅度谱的时候需要保存每一帧的相位信息，然后用保存好的相位信息和模型输出的幅度谱重构语音波形，代码如下所示。

spectrum = magnitude * np.exp(1.0j * phase)

基于Mask的语音增强

Mask这个单词有的地方翻译成掩蔽有的地方翻译成掩膜，我个人倾向于翻译成“掩蔽”，本文就用掩蔽作为Mask的翻译。

时频掩蔽

我们都知道语音信号可以通过时域波形或者频域的各种频谱表示，此外语谱图可以同时展示时域和频域的信息，因此被广泛应用，如下图所示。语谱图上的像素点就可以称为 时频单元 。

现在我们假设有两段语音信号，一段是纯净信号，另一段是噪声，他们混合在一起了，时域波形和对应的语谱图分别如下图所示：

如果我们想将纯净语音信号从混合信号中抽离在时域方面是很难做到的。现在我们从语谱图（语音的时频单元）角度入手去解决语音分离问题。首先我们提出两个假设：

1、我们假设信号能量稀疏的，即对于大多数时频区域它的能量为0，如下图所示，我们可以看到大多数区域的值，即频域能量为0。

2、我们假设信号能量不相交的，即它们的时频区域不重叠或者重叠较少，如下图所示，我们可以看到时频区域不为0的地方不重叠或者有较少部分的重叠。

基于以上两点假设，我们就可以分离我们想要的信号和噪声信号。给可能属于一个信号源的区域分配掩码为1，其余的分配掩码0，如下图所示。

我们通过0和1的二值掩码然后乘以混合信号的语谱图就可以得到我们想要喜好的语谱图了，如下图所示。

神经模型一般直接预测时频掩蔽M(t,f)M(t,f)，之后再通过M(t,f)M(t,f)与混合语音Y(t,f)Y(t,f)相乘得到预测的纯净语音^S(t,f)=^M(t,f)\otimesY(t,y)S^(t,f)=M^(t,f)\otimesY(t,y)，其中⊗⊗代表哈达玛乘积(Hadamard Product)。在语音增强研究的发展过程中，研究人员提出了一系列的时频掩蔽作为训练目标：

理想二值掩蔽（Ideal Binary Mask，IBM）

原理：由于 语音在时频域上是稀疏分布 的，对于一个具体的时频单元，语音和噪声的能量差异通常比较大，因此大多数时频单元上的信噪比极高或极低。IBM 是对这种现实情况的简化描述，将连续的时频单元信噪比离散化为两种状态 1 和0，在一个时频单元内：如果语音占主导（高信噪比），则被标记为 1；反之如果噪声占主导（低信噪比），则标记为 0 。最后将 IBM 和带噪语音相乘，实际上就是将低信噪比的时频单元置零，以此达到消除噪声的目的。

因此，IBM 的值由时频单元上的信噪比SNR(t,f)和设定的阈值比较之后决定：

公式1：IBM(t,f)={1,SNR(t,f)>LC0, else 公式1：IBM(t,f)={1,SNR⁡(t,f)>LC0, else

其中LC为阈值，一般取0，SNR计算公式为：

公式2：SNR(t,f)=10∗log10(|S(t,f)|2|N(t,f)|2)公式2：SNR⁡(t,f)=10∗log⁡10(|S(t,f)|2|N(t,f)|2)

优点：IBM 作为二值目标，只需要使用简单的二分类模型进行预测，并且可以有效地提高语音的可懂度。缺点：IBM 只有 0 和 1 两种取值，对带噪语音的处理过于粗暴，处理过程中引入了较大的噪声，无法有效地改善语音质量。

我看到过很多种写法

def IBM(clean_speech, noise): """计算 ideal binary mask (IBM) Erdogan, Hakan, et al. "Phase-sensitive and recognition-boosted speech separation using deep recurrent neural networks." ICASSP, 2015. :param clean_speech: 纯净语音 STFT :param noise: 噪声 STFT :return: 纯净语音的理想二值掩膜 IBM """ mask = np.zeros(np.shape(clean_speech), dtype=np.float32) mask[np.abs(clean_speech) >= np.abs(noise)] = 1.0 return mask

第二种

def IBM_SNR(clean_speech, noise_speech): """计算 ideal binary mask (IBM) Erdogan, Hakan, et al. "Phase-sensitive and recognition-boosted speech separation using deep recurrent neural networks." ICASSP, 2015. :param clean_speech: 纯净语音 STFT :param noise_speech: 带噪语音 STFT :return: 纯净语音的理想二值掩膜 IBM """ _eps = np.finfo(np.float).eps # 避免除以0 theta = 0.5 # a majority vote alpha = 1 # ratio of magnitudes mask = np.divide(np.abs(clean_speech) ** alpha, (_eps np.abs(noise_speech) ** alpha)) mask[np.where(mask >= theta)] = 1 mask[np.where(mask < theta)] = 0 return mask

第二种

第三种

def IBM_SNR(clean_speech, noise_speech,delta_size): """计算 ideal binary mask (IBM) Erdogan, Hakan, et al. "Phase-sensitive and recognition-boosted speech separation using deep recurrent neural networks." ICASSP, 2015. :param clean_speech: 纯净语音 STFT :param noise_speech: 带噪语音 STFT :return: 纯净语音的理想二值掩膜 IBM """ _eps = np.finfo(np.float).eps # 避免除以0 local_snr = 0 ibm = np.where(10. * np.log10(np.abs(clean_speech) ** 2 / np.abs(noise_speech) ** 2) >= local_snr, 1., 0.)


    if delta_size > 0:

        ibm = ibm[:, delta_size: -delta_size]

    return ibm

View Code

理想浮值掩蔽（Ideal Ratio Mask，IRM）

原理：基于语音和噪声正交，即不相关的假设下，即S(t,f)⋅N(t,f)=0S(t,f)⋅N(t,f)=0，IRM直接刻画了时频单元内纯净语音能量和带噪语音能量的比值，是目前使用非常广泛的一种掩蔽方法。

在这个假设下带噪语音的能量可以表示为：

公式2：|Y(t,f)|2=|S(t,f) N(t,f)|2=|S(t,f)|2 |N(t,f)|2公式2：|Y(t,f)|2=|S(t,f) N(t,f)|2=|S(t,f)|2 |N(t,f)|2

因此得到 IRM 为：

公式3：IRM(t,f)=(|S(t,f)|2|Y(t,f)|2)β=(|S(t,f)|2|S(t,f)|2 |N(t,f)|2)β公式3：IRM(t,f)=(|S(t,f)|2|Y(t,f)|2)β=(|S(t,f)|2|S(t,f)|2 |N(t,f)|2)β

其中ββ 为可调节尺度因子，一般取0.5。 IRM取值在 0 到 1 之间，值越大代表时频单元内语音占的比重越高。另外，IRM 的平方形式就是经典的维纳滤波器（Wiener Filter），它是均方误差意义上的最优滤波器。

优点：IRM 是分布在 0 到 1 的连续值，因此 IRM 是对目标语音更加准确的刻画，这使得 IRM 可以有效地同时提升语音的质量和可懂度。缺点：使用未处理的相位信息进行语音重构（相位对于感知质量也很重要）

def IRM(clean_speech, noise): """计算Compute ideal ratio mask (IRM) "Phase-sensitive and recognition-boosted speech separation using deep recurrent neural networks," in ICASSP 2015, Brisbane, April, 2015. :param clean_speech: 纯净语音 STFT :param noise: 噪音 STFT :return: 在原始音频域中分离(恢复)的语音 """ _eps = np.finfo(np.float).eps # 防止分母出现0 mask = np.abs(clean_speech) / (np.abs(clean_speech) np.abs(noise) _eps) return mask

def Wiener_like(clean_speech, noise): """计算Wiener-like Mask "Phase-sensitive and recognition-boosted speech separation using deep recurrent neural networks," in ICASSP 2015, Brisbane, April, 2015. :param clean_speech: 纯净语音 STFT :param noise: 噪音 STFT :return: 在原始音频域中分离(恢复)的语音 """ _eps = np.finfo(np.float).eps # 防止分母出现0 mask = np.divide((np.abs(clean_speech) ** 2 _eps), (np.abs(clean_speech) ** 2 np.abs(noise) ** 2) _eps) return mask

理想幅度掩蔽（Ideal Amplitude Mask，IAM）

原理：IAM也称为Spectral Magnitude Mask（SMM），不对噪声和语音做出正交假设，IAM刻画的也是纯净语音和带噪语音的能量比值

公式4：IAM(t,f)=|S(t,f)||Y(t,f)|公式4：IAM⁡(t,f)=|S(t,f)||Y(t,f)|

由于在语音和噪声叠加的过程中，存在反相相消的情况，因此并不能保证带噪语音的幅值总是大于纯净语音的幅值，因此 IAM 的范围是[0, ∞][0, ∞]。如果目标中出现非常大的数值，会导致训练过程出现异常。为了稳定训练，一般会将 IAM 进行截断到一定的范围内。为了确定合适的截断范围，我们可以在训练数据上采样 100 句语音并计算 IAM，就可以对IAM 的数值范围得到一个近似的估计，得到如图 3.4 的结果。一般将 IAM 截断到[0, 1]或者[0, 2]即可，因为只有非常少部分的 IAM 落在了[2, ∞][2, ∞]的区间内。

图* IAM数值分布直方图

def IAM(clean_speech, noise_speech): """计算ideal amplitude mask (IAM) "Phase-sensitive and recognition-boosted speech separation using deep recurrent neural networks," in ICASSP 2015, Brisbane, April, 2015. :param clean_speech: 纯净语音 STFT :param noise_speech: 带噪语音 STFT :return: """ _eps = np.finfo(np.float).eps # 避免除以0 mask = np.abs(clean_speech) / (np.abs(noise_speech) _eps) return mask

相位敏感掩蔽（Phase Sensitive Mask，PSM）

原理：PSM考虑到相位误差的时频掩蔽

PSM在形式上是 IAM 乘上纯净语音和带噪语音之间的余弦相似度

公式5：PSM(t,f)=|S(t,f)||Y(t,f)|cos(θS−θY)公式5：PSM(t,f)=|S(t,f)||Y(t,f)|cos⁡(θS−θY)

式中θS−θYθS−θY表示纯净语音和带噪语音的相位差，不难看出，PSM 的取值范围是[−∞, ∞][−∞, ∞]，因此也需要截断，我们同样使用直方图统计PSM的数值分布范围，从下图可以看出在0 和 1 附近出现两个明显的峰值，这也再次说明了 IBM 目标设计的合理性。为了方便，一般将 PSM 截断到[0, 1]，或者是适当将截断的区间放大到[-1, 2]。

PSM数值分布直方图

优点：纯净语音相位和带噪语音相位的差异，加入相位信息之后，PSM方法可以获得更高的SNR，因而降噪效果比IAM更好。

def PSM(clean_speech, noise_speech): """计算ideal phase-sensitive mask (PSM) :param clean_speech: 纯净语音 STFT :param noise_speech:带噪语音 STFT :return: """ _eps = np.finfo(np.float).eps # 防止分母出现0 clean_speech_phase = np.angle(clean_speech) noise_speech_phase = np.angle(noise_speech) mask = np.abs(clean_speech) / np.abs(noise_speech) * np.cos(clean_speech_phase - noise_speech_phase) # Truncated Phase Sensitive Masking # Theta = np.clip(np.cos(clean_speech_phase-noise_speech_phase), a_min=0., a_max=1.) # mask = np.divide(np.abs(clean_speech), _eps np.abs(noise_speech)) * Theta return mask

复数理想浮值掩蔽（Complex Ideal Ratio Mask，cIRM）

参考文献：2015_ Complex ratio masking for monaural speech separation

原理：在复数域的理想浮值掩膜，同时增强幅度谱和相位谱

条件：⎧⎪ ⎪ ⎪ ⎪⎨⎪ ⎪ ⎪ ⎪⎩Y=Yr iYiM=Mr iMiS=Sr iSiSt,f=Mt,f∗Yt,f条件：{Y=Yr iYiM=Mr iMiS=Sr iSiSt,f=Mt,f∗Yt,f==>Sr iSi=(Mr iMi)∗(Yr iYi)=(MrYr−MiYi) i(MrYi MiYr)Sr iSi=(Mr iMi)∗(Yr iYi)=(MrYr−MiYi) i(MrYi MiYr)，

那么：{Sr=MrYr−MiYiSi=MrYi MiYr{Sr=MrYr−MiYiSi=MrYi MiYr解方程得：⎧⎪⎨⎪⎩Mr=YrSr YiSiY2r Y2iMi=YrSi−YiSrY2r Y2i{Mr=YrSr YiSiYr2 Yi2Mi=YrSi−YiSrYr2 Yi2

最终：McIRM=Mr iMi=YrSr YiSiY2r Y2i iYrSi−YiSrY2r Y2iMcIRM=Mr iMi=YrSr YiSiYr2 Yi2 iYrSi−YiSrYr2 Yi2

式中，YY是带噪语音，SS是纯净语音。

优点：cIRM能够同时增强嘈杂语音的幅度和相位响应，cIRM是加性噪声假设下的最优掩蔽，可以从带噪语音中完美重构纯净语音信号

def cIRM(clean_speech, noise_speech): """使用复理想比率掩码将语音从源信号的短时傅里叶变换和混合源信号的短时傅里叶变换中分离出来 :param clean_speech:纯净语音 :param noise_speech:带噪语音 :return: """ cIRM_r = (np.real(noise_speech) * np.real(clean_speech) np.imag(noise_speech) * np.imag(clean_speech)) / \ (np.real(noise_speech) ** 2 np.imag(noise_speech) ** 2)


    cIRM_i = (np.real(noise_speech) * np.imag(clean_speech) - np.imag(noise_speech) * np.real(clean_speech)) / \

             (np.real(noise_speech) ** 2   np.imag(noise_speech) ** 2)

mask = cIRM_r cIRM_i * 1j return mask

总结

语音增强中的大部分掩蔽类方法，都可以看成在 特定的假设条件下cIRM 的近似 。如果将 cIRM 在直角坐标系下分解，cIRM 在实数轴上的投影就是 PSM 。如果再将 cIRM在极坐标系下分解，cIRM 的模值就是 IAM 。而 IRM 又是 IAM 在噪声语音不相关假设下的简化形式， IBM 则可以认为是 IRM 的二值版本。

各种理想掩蔽的性能比较

度量IBMIRMIAMPSMcIRMPESQ2.473.333.453.714.49STOI0.910.940.970.971

从上表中我们可以看到 cIRM 可以实现对纯净语音几乎无损地重构，其他掩蔽由于进行了某些特定的假设，所以都会在一定程度上造成性能损失。虽然 cIRM 是最优掩蔽，但是使用其他简化的掩蔽方法可以降低预测的难度。这也是早期的语音增强研究选择使用 IBM 或者是 IRM 等简单掩蔽目标的原因。在模型容量有限的情况下，cIRM 经常并不是最好的选择，选择和模型建模能力匹配的目标才能获得最优的增强性能。

题外话

但是，这里存在一个问题，我们无法从语谱图中还原语音信号。为了解决这一问题，我们首先还原所有的频率分量，即对二值掩码做个镜像后拼接。假设我们计算语谱图时使用的是512点SFTF，我们一般去前257点进行分析和处理，在这里我们将前257点的后255做镜像，然后拼接在一起得到512点频率分量，如下图所示。

然后根据这个还原语音信号。这里指的一提的是，在进行STFT后的相位信息要保存，用于还原语音信号。

基于掩蔽的语音增强和基于映射的语音增强模型训练和增强过程类似，这里只提几个重要的地方，其余地方参考上面内容。

Label ：数据的label为根据信噪比计算的IBM或者IRM，这里只需要一帧就够了 损失函数 ：IBM的损失函数可以用交叉熵，IRM的损失函数还是用均方差 最后一层的激活函数 ：IBM只有0和1两个值，IRM范围为[0,1]，因此采用sigmoid激活函数就可以了 重构波形 ：首先用噪声幅度谱与计算的Mask值对应位置相乘，代码如下，然后根据相位信息重构语音波形。

enhance_magnitude = np.multiply(magnitude, mask)

Demo效果以及代码

首先看下实验效果，首先是基于映射语音增强的结果：

基于IBM语音增强的结果：

基于IRM语音增强的结果：

训练代码：

""" @FileName: IBM.py @Description: Implement IBM @Author: Ryuk @CreateDate: 2020/05/08 @LastEditTime: 2020/05/08 @LastEditors: Please set LastEditors @Version: v0.1 """

import numpy as np import librosa from sklearn.preprocessing import StandardScaler from keras.layers import * from keras.models import Sequential def generateDataset(): mix, sr = librosa.load("./mix.wav", sr=8000) clean,sr = librosa.load("./clean.wav", sr=8000) win_length = 256 hop_length = 128 nfft = 512 mix_spectrum = librosa.stft(mix, win_length=win_length, hop_length=hop_length, n_fft=nfft) clean_spectrum = librosa.stft(clean, win_length=win_length, hop_length=hop_length, n_fft=nfft) mix_mag = np.abs(mix_spectrum).T clean_mag = np.abs(clean_spectrum).T frame_num = mix_mag.shape[0] - 4 feature = np.zeros([frame_num, 257*5]) k = 0 for i in range(frame_num - 4): frame = mix_mag[k:k 5] feature[i] = np.reshape(frame, 257*5) k = 1 snr = np.divide(clean_mag, mix_mag) mask = np.around(snr, 0) mask[np.isnan(mask)] = 1 mask[mask > 1] = 1 label = mask[2:-2] ss = StandardScaler() feature = ss.fit_transform(feature) return feature, label def getModel(): model = Sequential() model.add(Dense(2048, input_dim=1285)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(2048)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(2048)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(257)) model.add(BatchNormalization()) model.add(Activation('sigmoid')) return model def train(feature, label, model): model.compile(optimizer='adam', loss='mse', metrics=['mse']) model.fit(feature, label, batch_size=128, epochs=20, validation_split=0.1) model.save("./model.h5") def main(): feature, label = generateDataset() model = getModel() train(feature, label, model) if __name__ == "__main__": main()

增强代码：

""" @FileName: Inference.py @Description: Implement Inference @Author: Ryuk @CreateDate: 2020/05/08 @LastEditTime: 2020/05/08 @LastEditors: Please set LastEditors @Version: v0.1 """ import librosa import numpy as np from basic_functions import * import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler from keras.models import load_model def show(data, s): plt.figure(1) ax1 = plt.subplot(2, 1, 1) ax2 = plt.subplot(2, 1, 2) plt.sca(ax1) plt.plot(data) plt.sca(ax2) plt.plot(s) plt.show() model = load_model("./model.h5") data, fs = librosa.load("./test.wav", sr=8000) win_length = 256 hop_length = 128 nfft = 512 spectrum = librosa.stft(data, win_length=win_length, hop_length=hop_length, n_fft=nfft) magnitude = np.abs(spectrum).T phase = np.angle(spectrum).T frame_num = magnitude.shape[0] - 4 feature = np.zeros([frame_num, 257 * 5]) k = 0 for i in range(frame_num - 4): frame = magnitude[k:k 5] feature[i] = np.reshape(frame, 257 * 5) k = 1 ss = StandardScaler() feature = ss.fit_transform(feature) mask = model.predict(feature) mask[mask > 0.5] = 1 mask[mask <= 0.5] = 0 fig = plt.figure() plt.imshow(mask, cmap='Greys', interpolation='none') plt.show() plt.close(fig) magnitude = magnitude[2:-2] en_magnitude = np.multiply(magnitude, mask) phase = phase[2:-2] en_spectrum = en_magnitude.T * np.exp(1.0j * phase.T) frame = librosa.istft(en_spectrum, win_length=win_length, hop_length=hop_length) show(data, frame) librosa.output.write_wav("./output.wav",frame, sr=8000)

参考

【论文】2020_李劲东_基于深度学习的单通道语音增强研究

【博客文章】 DNN单通道语音增强(附Demo代码)

【博客文章】基于Mask的语音分离

【github代码】 speech-segmentation-project/masks.py

【github代码】 ASP/MaskingMethods.py

【github代码】 DC-TesNet/time_domain_mask.py

【github代码】 ASC_baseline/compute_mask.py

本文代码请见： https://github.com/Ryuk17/SpeechAlgorithms

作者:凌逆战

博客地址（转载请指明出处）： https://www.cnblogs.com/LXP-Never/p/14142108.html

halcon深度学习分几步（机器视觉halcon学习系列---XLD的介绍和使用）

定义

XLD是eXtended Line Description的缩写，中文你可以直译过来解释为 扩展线的描述，XLD可以来表达轮廓和多边形数据。XLD属于图像变量，轮廓是一系列的二维点组成，一系列点连接成线，这里的可以看到这些连接的线是从像素中穿过去的，我们叫这是亚像素精度（sub_pixel），在halcon中，XLD不仅包括点集，而且XLD里面保存了局部和全局的属性，典型的属性有点的幅度以及轮廓分割的回归参数

XLD轮廓

在halcon中，还可以对轮廓XLD进行一系列的处理，例如可以通过select_shape_xld选择特定的特征对象XLD，还可以segment_contour_xld来把轮廓分割，还可以把union_*_contours_xld一系列算子对轮廓进行合并等操作。

我们认识了XLD之后，我们可以使用XLD拿来干嘛呢？ XLD可以用来做测量，XLD创建模板，XLD可以用来拟合直线等。

获取XLD

在获取XLD中，一种是交互式画XLD，draw_xld，这种方式在实际基本没有使用，意义不大。还有一种是通过read_contour_xld_dxf读取XLD，这是通过CAD画的轮廓图，或者通过write_contour_xld_dxf写入的轮廓，这里面可能在某些应用中会使用，前期通过CAD建模，读取到XLD后我们就可以拿来用作匹配的轮廓。

xld保存

dxf轮廓转换

还有一种方式是直接通过算法来获取XLD轮廓，在这里是基于亚像素的轮廓，对应着有彩色图像和灰度图像的获取。edge_color_sub_pix、edges_sub_pix,这两个算子我们会经常使用。

我们还可以通过gen_contour_*_xld系列算子来转换成XLD，只不过，在这里有些是亚像素精度，有些是像素精度。

当我们得到轮廓后，还需要对轮廓进行修饰，常用的使用select_shap_xld，主要的特征有四类，基本、形状、点、moments等特征。

select_shape_xld

有时候也需要对轮廓进行分割，通过segment_contours_xld来进行分割，获取特定轮廓的坐标点通过get_contour_xld算子获取，这个算子输出轮廓的坐标点集，我们可以使用这些点集来进行特定的应用，可以是拟合直线、拟合圆、判断最大最小值，这就是你的业务逻辑的事情了。

总结一下，XLD是halcon里面的一种数据格式，把点集封装了一下，点集连接成线，这些点集有一些自己的特性，halcon已经封装好了，XLD在应用中是广泛使用的一种工具，用来分割图像特征，学会使用XLD工具会给我们工作带来极大的便利。

深度学习英语教学（读CNN学英语感恩生活）

How to become more grateful, and why that will make you happier, healthier and more resilient

resilient [rɪˈzɪliənt]有弹性(或弹力)的；可迅速恢复的；有适应力的；能复原的

(CNN) – If you really think about it, so many of us should be in a perpetual state of gratitude.

think about it 思考；想一想；想想看 perpetual [pəˈpetʃuəl]永恒的；永久的；没完没了的；不间断的；持续的；长久的 gratitude n. 感激；感谢

Which of these do you have going for you right now? Family. Friends. Love. Health. Freedom from war and natural disaster. Imagination. Community. A roof over our heads. Common decency. Hope. Opportunity. Memories. Financial stability. Favorite places. Days off work. Good weather. The golden age of television. Books. Music. Ice cream. Weekends. A friendly exchange. Something good that happened today. Something bad that didn't happen today. A good cup of coffee.

have sth going for sb 具有某种有利条件或优势 freedom from 免于；没有 decency [ˈdiːsnsi]体面；端庄 days off work 休息天 exchange 交流；互动

You may not have everything you want (or even need) on my list or yours, but that probably still leaves buckets — nay, container ships — full of tangible and conceptual items for which to be grateful. Things can always be better, but they can always be worse. It often depends on how you look at that proverbial glass of water.

bucket 水桶 nay (强调刚提及之事)不仅如此；不 container ship 集装箱船 tangible [ˈtændʒəbl]有形的；实际的；真实的；可触摸的；可触知的；可感知的 conceptual 概念(上)的；观念(上)的 depend on 取决于 proverbial [prəˈvɜːrbiəl]谚语的；谚语表达的；如谚语所说的；众所周知；著名

To get in better touch with gratefulness — and get the health benefits of doing so — the trick is to find easy ways to count blessings more often than, say, over an annual turkey dinner. Keep your thankfulness boiling on the front burner of your mind, and you will increase your general appreciation of life.

get in touch with 接触 trick 诀窍；秘诀 blessings 上帝的恩宠；祝福；祝颂；赞同；许可；好事；有益之事 turkey dinner 感恩节火鸡大餐 on the front burner 处于首要地位 appreciation 欣赏；理解；体谅；同情；感激；感谢

Try to be more grateful for the small, mundane things that give you joy and meaning, as well as the big ones. Acknowledging just a handful each day will benefit you, and there are ways to make that a habit.

mundane [mʌnˈdeɪn]单调的；平凡的

Whatever way you start infusing your life with more moments of gratitude, in the short and long term, you will be grateful that you did.

infuse with 灌入,灌输,注入 in the short/long term 短期/长期来看

本文Hash：a0974117245989fb64777c5a6b4a606eb6dd149e

声明：此文由 Mike 分享发布，并不意味布布狗赞同其观点。文章内容仅供参考，此文如侵犯到您的合法权益，请联系我们。

39 151

不要太容易相信别人用英语怎么说（用鸽子也可以损人）

下一篇 2022-11-19

三星note20 ultra边框掉漆（网友哭诉新买的三星Galaxy）

上一篇 2022-11-19

高二化学电化学基础（高三化学复习专题五）

Ⅰ.原电池【考点1】原电池原理 1.构成条件 (1)自发的氧化还原反应：（强还原剂在负极上自发的失去电子，被氧化；氧化剂在正极上自发的得到电子，被还原。） (2)两个不同材料的电极：两极都是固体材料。正极：能导电的固体，两个作用：一是只导电，不参加反应。参加反应的是溶液中的离子或溶于溶液中的氧化性气体。二是即导电又作氧化剂。负极：一是比正极活泼的金属，作还原剂参

ninja
2022-11-19
751 29 85
学习正确的使用狗绳训练狗

学习正确的使用狗绳训练狗如果有一个封闭而足够大的院子让狗自由活动，那当然最好不过。但是，如果要带狗出门上街，那么最好还是牵好狗绳。否则，狗可能会跑到马路上发生意外，或者追逐其他小狗而走失，哪怕他只是因为好奇而闻闻路人的裤脚，也可能给主人带来不必要的麻烦(毕竟，我们不能要求每个人都喜欢小狗)。所以，牵好狗绳并不是对狗的虐待，而是对他的保护。狗绳的正确牵法是成功地训练狗的关键。绳子的状态，应是

一正一邪
2022-11-19
218 33 224
数学与应用数学就业前景（数学与应用数学专业就业方向）

1、T业职员就业分析：数学与应用数学专业属于基础专业，是其他相关专业的母专业。该专业的毕业生如欲转行进入科研数据分析、软件开发、三维动画制作等职业，具备先天的优势。在改进一个软件的速度、效率，需要新的思想和方法方面，数学高手创新能力比一般计算机专业的学生还要强。在一项针对IT行业230名成功人士的抽样调查表明，其中200名属于以数学专业或其相关专业为依托实现职业再选择的人。 2、商务人员

jingling
2022-11-19
1795 62 188
布布狗

狗狗到底能不能喝牛奶关于狗狗喝牛奶的深度解析

狗狗不能喝牛奶牛奶含有的乳糖狗狗吸收不了，很多狗狗都有乳糖不耐受的症状，狗狗无法代谢牛奶中的糖，因为消化器官难以代谢，而且牛奶的含量主要是低蛋白质、低脂肪和高乳糖，而狗狗所需要的应该是高蛋白质、高脂肪和低乳糖，哈士奇的需求与牛奶的营养含量是完全相反的。长期给狗狗喂食牛奶，严重的甚至会出现肾脏早衰等后果。尤其是幼犬，喝牛奶可能导致拉稀脱水死亡。狗狗补钙不一定非要喝奶奶中固然含有丰

谢绝崇拜
2022-11-03
1910 75 84
基础知识都学杂了（学习点很杂很杂的杂学知识14）

微波炉烤地瓜好吃吗？在大街上烤地瓜的人基本上都用火炉，但通常是隔着铁板来烤，从不用明火直接烤。烤出来的地瓜焦黄焦黄的，散发出一种诱人的香气，让人垂涎欲滴。可惜用微波炉来烤地瓜，却达不到同样的效果。同样一块地瓜，用微波炉和用传统烤法烤出来完全不是一种味道。原来，用微波炉或明火直接烘烤地瓜，地瓜很快就会被烤透，不过由于时间太过仓促，导致其中所含的淀粉难以快速转话为糖分。也就是说，这种方法烤出来

Mike
2022-11-23
203 33 35
小升初英语专项练习动词（小升初英语语法可数名词复数的规则变化）

今日为大家讲解的是小升初必考知识点：可数名词的单数和复数以及可数名词复数的规则变化可数名词的单数和复数名词单数就是该词本身，在其前面加a或an。 1）单数如：adesk（一张桌子） anolddesk（一张旧书桌） 2）复数：要表示一个以上概念时，要用名词复数形式可数名词的规则变化 1）一般情况下加-s　如book–books（书）　 desk

ninja
2022-11-19
49 12 47
关于科学的资料（关于科学的相关知识）

关于科学的资料?科学，是建立在可检验的解释和对客观事物的形式、组织等进行预测的有序知识系统，是已系统化和公式化了的知识，我来为大家科普一下关于关于科学的资料?下面希望有你要的答案，我们一起来看看吧! 关于科学的资料科学，是建立在可检验的解释和对客观事物的形式、组织等进行预测的有序知识系统，是已系统化和公式化了的知识。根据这些（科学）系统知识所要反映对象的领域，主要可分为自然科学、社会科学、思

leaf
2022-11-23
621 22 72
关于冬奥的相关资料（读懂这份冬奥长名单背后的深意）

1月28日，距北京2022年冬奥会开幕还有一周。一份名单的发布，引人关注—— 细看这份名单不难发现，出席北京冬奥会开幕式的各方来宾具有广泛代表性：从非洲到拉美、从亚洲到欧洲皆有，还有联合国、世卫组织等国际组织负责人。在新冠肺炎疫情全球肆虐的大背景下，这份名单充分表明世界对中国的信任与支持，也考验着中方在复杂严峻形势面前的防疫和办赛水平。从这份不一般的长名单中，我们读出了几重深意。 “

ninja
2022-11-19
938 1 267
初一语文下册16课预习（寒假预习学习资料）

寒假生活正式启动，孩子们也开始预习下学期的课程。人教版初一语文下册，孩子每天预习一课，分享给大家，有需要的同学可以根据自己进度提前预习。 ,

一正一邪
2022-11-23
1586 7 143
小狐狸英文学习（英语轻松学之TheCoyote）

绘本赏析作者：LindaB.Ross 适读年龄：5-12岁爱吹牛的小狼说自己比风跑得还快，他要跟兔子比赛谁跑得快。机智的兔子们决定在比赛中捉弄小狼，并且最终赢得了比赛，小狼以后也再不敢吹牛了。那兔子兄弟们是如何捉弄小狼的呢？小朋友们来看看吧。 Longago,CoyotemetRabbitinthewoods. 很久很久以前，小狼在丛林里遇到了一只兔子。

jingling
2022-11-19
739 35 162
布布狗

三个月的小猫会自己拉屎吗要引导小猫学习使用猫砂

三个月的小猫会自己拉屎吗三个月的小猫会自己拉屎，一般小猫出生一个月之后就会自己拉屎了。小猫小时候都是由母猫舔舐来刺激排便，长大后就会自主排便了。小猫会自己拉屎之后，小猫想拉屎的可以把猫咪放在猫砂盆里，让猫咪习惯在猫砂盆里进行排泄。猫砂盆不要太大，否则小猫爬不进去。

lizhen002
2022-08-07
1658 42 137
布布狗

猫深度睡眠的状态

猫睡觉为什么会一直动尾巴，它是睡着了吗？怎么判断一只猫是不是睡着了？来看了你就懂现在越来越多人在家里养宠物猫，养一只猫咪在家里也是很有趣，常常被它的言行被搞得摸不着头脑，真的是哭笑不得。养猫的朋友都知道，它大部分的时候都是在睡觉度过的，资料记载猫的一生有3/2的时间都是在睡觉，但是猫咪的睡眠跟人是不一样的，人是睡整觉而猫咪每次的睡眠时间不长，正常都不超过一个小时，但是每天要睡好几次，加起来的时间就

一正一邪
2022-11-08
735 16 221
布布狗

红腹鹦鹉的物种属性、外形特征、生活习性、生长繁殖、地理分布、喂养、教育、学舌的奥秘、其他相关之身体语言、参考资料

红腹鹦鹉（学名：Poicephalusrufiventris，英文名：Red-belliedParrot）是鹦鹉科大头鹦鹉属的鸟类。红腹鹦鹉与大部分波斯菲勒斯属的鹦鹉一样，红腹鹦鹉是很安静的非洲鹦鹉，有别于其他同属的鹦鹉，它们的性别可由外表轻易地判定，公鸟的腹部为橘色，母鸟则是灰绿色，手养鸟是不错的宠物鸟。红腹鹦鹉也是波斯菲勒斯鹦鹉中说话能力较佳的种类，也比较外向一些，通常公鸟的学话及模仿

谢绝崇拜
2022-11-19
1398 25 68
数控机床快速加工刀具（关于数控机床的机加工切削刀具的几大业务类问题）

数控机床快速加工刀具?刀具行业的主要产品类：车刀，铣刀，孔加工刀具（钻头.铰刀.镗刀.丝锥），复杂刀具（滚刀.拉刀），我来为大家讲解一下关于数控机床快速加工刀具?跟着小编一起来看一看吧! 数控机床快速加工刀具刀具行业的主要产品大类及其应用领域及主要客户分布，各类产品主要头部生产企业情况简介刀具行业的主要产品类：车刀，铣刀，孔加工刀具（钻头.铰刀.镗刀.丝锥），复杂刀具（滚刀.拉刀）。

梦相随
2022-11-19
239 9 130
布布狗

关于猫的科学小知识

怎么样打猫最科学?爱问知识人我从来不打我家猫猫，都是它爸爸打用一特轻的拖鞋飞过去，一边大声训它，猫跑的快基本上打不着，不过它很怕呀，一见它爸爸就跑。历史上有哪些颠覆三观的冷知识？说一个科学史上的冷知识吧，大家都知道爱迪生在课本上被描绘成一个勤奋努力的人，为发明电灯尝试过1000多种材料，失败多少次都不气馁继续坚持，那句“天才是99%努力+1%灵感”正是出自爱迪生之口。但其实事实不是这样的，由于课

maylee
2022-11-08
95 75 36

深度学习用于工业参数优化（基于深度学习的单通道语音增强）

halcon深度学习分几步（机器视觉halcon学习系列---XLD的介绍和使用）

深度学习英语教学（读CNN学英语感恩生活）

相关推荐