不乱于心,不困于情。
不畏将来,不念过往。如此,安好。

machine-learn

清理文本数据-seo优化_前端开发_渗透技术

清理文本数据

hush阅读(220)赞(0)

目录 介绍 清除文本数据 总结 参考引用 介绍 数据在大多数情况下都是杂乱无章、杂乱无章、难以处理的,这一点也不足为奇。 当你从教育实践中学习数据科学时,你将看到大多数数据都是从多个来源、多个查询中获得的,这可能会导致一些不干净的数据。 在...

垃圾邮件检测:第2部分-seo优化_前端开发_渗透技术

垃圾邮件检测:第2部分

hush阅读(226)赞(0)

介绍 对自然语言进行分类是当今自然语言处理面临的巨大挑战之一。 它涉及到能够有效区分目标文本和正常文本的技术。其他服务,如聊天机器人,也严重依赖用户输入的文本。他们需要处理大量数据,以确定用户需求并引导正确的路径。 Tensorflow的使...

垃圾邮件检测.第1部分-seo优化_前端开发_渗透技术

垃圾邮件检测.第1部分

hush阅读(250)赞(0)

垃圾邮件检测是机器学习算法在过滤垃圾邮件方面的一个重要应用。在自然语言处理领域,有几种算法可用于此类分类。通常垃圾邮件都有一些典型的词语。 在本文中,我们将使用nltk软件包详细介绍垃圾邮件和非垃圾邮件的文本处理。特别是我们将看到NLP的词...

探索深度学习库——Keras-seo优化_前端开发_渗透技术

探索深度学习库——Keras

hush阅读(211)赞(0)

介绍 Keras 最初是作为 Theano 的一个方便的附加组件而发展起来的,长久以来,Keras首早先开始支持Tensorflow,然后完全成为其中的一部分。然而,我们的文章不会致力于讲述这个框架的复杂命运,而是它的功能。 安装 安装 K...

中文分词利器 jieba 和 HanLP-seo优化_前端开发_渗透技术

中文分词利器 jieba 和 HanLP

hush阅读(600)赞(0)

前言 从本文开始,我们进入实战部分。首先,我们按照中文自然语言处理流程的第一步获取语料,然后重点进行中文分词的学习。中文分词有很多种,常见的比如有中科院计算所 NLPIR、哈工大 LTP、清华大学 THULAC 、斯坦福分词器、Hanlp ...

主成分分析(PCA)原理详解-seo优化_前端开发_渗透技术

主成分分析(PCA)原理详解

hush阅读(523)赞(0)

1.相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的工作量。更重要的是在很多情形下,许多变量之间可能...

详解CNN卷积神经网络-seo优化_前端开发_渗透技术

详解CNN卷积神经网络

hush阅读(457)赞(0)

概揽 卷积神经网络(Convolutional Neural Networks / CNNs / ConvNets)与普通神经网络非常相似,它们都由具有可学习的权重和偏置常量(biases)的神经元组成。每个神经元都接收一些输入,并做一些点...

Python中决策树分类器DecisionTreeClassifier参数

hush阅读(521)赞(0)

一、参数 criterion: 特征选择标准,【entropy, gini】。默认gini,即CART算法。 splitter: 特征划分标准,【best, random】。best在特征的所有划分点中找出最优的划分点,random随机的在...

数据预处理之独热编码(One-Hot)-seo优化_前端开发_渗透技术

数据预处理之独热编码(One-Hot)

hush阅读(476)赞(0)

前言 ———————————————————————————————————————— 在机器学习算法中,我们经常会遇到分类特征,例如:人的性别有男女,祖国有中国,美国,法国等。 这些特征值并不是连续的,而是离散的,无序的。通常我们需要对其...