Neural Networks Tutorial
123# For tips on running notebooks in Google Colab, see# https://pytorch.org/tutorials/beginner/colab%matplotlib inline
Neural Networks
Neural networks can be constructed using the torch.nn package.
Now that you had a glimpse of autograd, nn depends on autograd to define models and differentiate them. An nn.Module contains layers, and a method forward(input) that returns the output.
For example, look at this network that classifies digit images:
It is a simple feed-forward network. It takes the ...
Autograd Tutorial
123# For tips on running notebooks in Google Colab, see# https://pytorch.org/tutorials/beginner/colab%matplotlib inline
A Gentle Introduction to torch.autograd
torch.autograd is PyTorch’s automatic differentiation engine that powers neural network training. In this section, you will get a conceptual understanding of how autograd helps a neural network train.
Background:神经网络
Neural networks (NNs) are a collection of nested functions that are executed on some input data. These functions are define ...
Tensor Tutorial
123# For tips on running notebooks in Google Colab, see# https://pytorch.org/tutorials/beginner/colab%matplotlib inline
Tensors
Tensors are a specialized data structure that are very similar to arrays and matrices. In PyTorch, we use tensors to encode the inputs and outputs of a model, as well as the model’s parameters.
Tensors are similar to NumPy’s ndarrays, except that tensors can run on GPUs or other specialized hardware to accelerate computing. If you’re familiar with ndarrays, you’ll be ri ...
CNN(1)
多层感知机十分适合处理表格数据,其中行对应样本,列对应特征。然而对于高维感知数据(图像),这种缺少结构的网络可能会变得不实用。
图像处理的问题
图像需要处理的数据量太大,导致成本很高,效率很低
图像是由像素构成的,每个像素又是由颜色构成的。如果一张图片像素为1000×1000,每个像素有RGB三个信息表示颜色信息,则一张图片需要处理三百万个参数。
**CNN 解决的第一个问题就是「将复杂问题简化」,把大量参数降维成少量参数,再做处理。**我们在大部分场景下,降维并不会影响结果。比如1000像素的图片缩小成200像素,并不影响肉眼认出来图片中是一只猫还是一只狗,机器也是如此。
图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高
假如有圆形是1,没有圆形是0,那么圆形的位置不同就会产生完全不同的数据表达。但是从视觉的角度来看,图像的内容(本质)并没有发生变化,只是位置发生了变化。
CNN用类似视觉的方式保留了图像的特征,当图像做翻转,旋转或者变换位置时,它也能有效的识别出来是类似的图像。
人类视觉原理
从原始信号摄入开始(瞳孔摄入像素 Pi ...
Large-Scale ML [lecture 1\2]
lecture 1
标准机器学习过程
数据收集和准备:数据收集、数据清洗和预处理(处理缺失值、去除噪声、处理异常值;归一化、特征提取等)
模型选择与训练:根据问题类型选择适当的模型类型(如线性回归、决策树、神经网络等)
validation
test
deployment
12Q:validation和test的区别?A:验证阶段主要用于模型的调优,包括选择最佳的超参数和避免过拟合。测试阶段主要用于评估模型的最终性能,衡量模型在未见过的数据上的泛化能力。
扩展到大数据上的难点
实时数据
12Q:具体指什么?ssA:实时数据是指一些应用场景下的数据,数据持续到来,意味着数据集是变化的。比如物联网的感知场景、视频/广告点击率预测场景、天气预测场景。
模型选择,更大范围的参数调整
大型数据集上的训练时间
对延迟、吞吐量和内存使用有要求的情况下,模型怎么推理和部署
在扩展机器学习时,应该遵守的原则
使用三个方向的技术:统计学、最优化、系统架构?
统计学:通过处理小型随机子样本,可以更轻松地处理大型数据集。
1具体指什么?
最优化:将您的学习任务编 ...
Instruction
aid和bvid估计是视频id
cid应该是客户端id,删去也不影响链接视频播放
page表示是选集里的第几个视频
as_wide表示是否为宽屏
high_quality表示是否高清
danmaku表示是否开启弹幕
allowfullscreen="ture"允许全屏
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick Start
Create a new post
1$ hexo new "My New Post"
More info: Writing
Run server
1$ hexo server
More info: Server
Generate static files
1$ hexo generate
More info: Generating
Deploy to remote sites
1$ hexo deploy
More info: Deployment