最新 最热

数据科学和人工智能技术笔记 十六、朴素贝叶斯

伯努利朴素贝叶斯分类器假设我们的所有特征都是二元的,它们仅有两个值(例如,已经是独热编码的标称分类特征)。

2022-12-02
1

数据科学和人工智能技术笔记 十五、支持向量机

SVC 使用超平面来创建决策区域,不会自然输出观察是某一类成员的概率估计。 但是,我们实际上可以通过一些技巧输出校准的类概率。 在 SVC 中,可以使用 Platt 缩放,其中首先训练 SVC,然后训练单独的交叉验证逻辑回归来将 SVC...

2022-12-02
2

数据科学和人工智能技术笔记 十四、K 最近邻

: 研究者指定的正数。 K 表示最接近特定观测的观测数,它定义了“邻域”。 例如,K = 2意味着每个观测都有一个邻域,包含最接近它的另外两个观测。

2022-12-02
1

数据科学和人工智能技术笔记 十三、树和森林

最重要的参数是base_estimator,n_estimators和learning_rate。

2022-12-02
1

数据科学和人工智能技术笔记 十一、线性回归

表示两者之间的交互。使用 scikit-learn 的PolynomialFeatures,来为所有特征组合创建交互术项会很有用。 然后,我们可以使用模型选择策略,来识别产生最佳模型的特征和交互项的组合。...

2022-12-02
1

数据科学和人工智能技术笔记 十二、逻辑回归

scikit-learn 的LogisticRegressionCV方法包含一个参数C。 如果提供了一个列表,C是可供选择的候选超参数值。 如果提供了一个整数,C的这么多个候选值,将从 0.0001 和 10000 之间的对数标度(C的合理值范围)中提取。...

2022-12-02
1

数据科学和人工智能技术笔记 九、模型验证

在本教程中,我们将使用着名的鸢尾花数据集。鸢尾花数据包含 150 种鸢尾花的四个测量值,以及它的品种。 我们将使用支持向量分类器来预测鸢尾花的品种。...

2022-12-02
1

数据科学和人工智能技术笔记 二、数据准备

波士顿住房数据集 是 20 世纪 70 年代的着名数据集。 它包含506个关于波士顿周边房价的观测。 它通常用于回归示例,包含 15 个特征。

2022-12-02
1

SciPyCon 2018 sklearn 教程(上)

机器学习是自动从数据中提取知识的过程,通常是为了预测新的,看不见的数据。一个典型的例子是垃圾邮件过滤器,用户将传入的邮件标记为垃圾邮件或非垃圾邮件。然后,机器学习算法从数据“学习”预测模型,数据区分垃圾邮件和普...

2022-12-02
1

TensorFlow Eager 教程

大家好! 在本教程中,我们将使用 TensorFlow 的命令模式构建一个简单的前馈神经网络。 希望你会发现它很有用! 如果你对如何改进代码有任何建议,请告诉我。...

2022-12-02
1