不乱于心,不困于情。
不畏将来,不念过往。如此,安好。

machine-learn

中文分词利器 jieba 和 HanLP-seo优化_前端开发_渗透技术

中文分词利器 jieba 和 HanLP

hush阅读(120)赞(0)

前言 从本文开始,我们进入实战部分。首先,我们按照中文自然语言处理流程的第一步获取语料,然后重点进行中文分词的学习。中文分词有很多种,常见的比如有中科院计算所 NLPIR、哈工大 LTP、清华大学 THULAC 、斯坦福分词器、Hanlp ...

主成分分析(PCA)原理详解-seo优化_前端开发_渗透技术

主成分分析(PCA)原理详解

hush阅读(135)赞(0)

1.相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的工作量。更重要的是在很多情形下,许多变量之间可能...

详解CNN卷积神经网络-seo优化_前端开发_渗透技术

详解CNN卷积神经网络

hush阅读(69)赞(0)

概揽 卷积神经网络(Convolutional Neural Networks / CNNs / ConvNets)与普通神经网络非常相似,它们都由具有可学习的权重和偏置常量(biases)的神经元组成。每个神经元都接收一些输入,并做一些点...

Python中决策树分类器DecisionTreeClassifier参数

hush阅读(55)赞(0)

一、参数 criterion: 特征选择标准,【entropy, gini】。默认gini,即CART算法。 splitter: 特征划分标准,【best, random】。best在特征的所有划分点中找出最优的划分点,random随机的在...

数据预处理之独热编码(One-Hot)-seo优化_前端开发_渗透技术

数据预处理之独热编码(One-Hot)

hush阅读(57)赞(0)

前言 ———————————————————————————————————————— 在机器学习算法中,我们经常会遇到分类特征,例如:人的性别有男女,祖国有中国,美国,法国等。 这些特征值并不是连续的,而是离散的,无序的。通常我们需要对其...