前言

本文简述了离散型分布,阐明了泊松分布的来源,推导出泊松分布的公式,列举了泊松分布常用的情况,总结了泊松分布相关数值。

离散型分布概述

离散型分布包括几何分布、超几何分布、二项分布和泊松分布。其中二项分布和泊松分布最重要。

伯努利试验

对于一个试验(事件),如果重复发生的概率是独立地(上一次的结果不影响这次),那么它是独立试验。特别地,如果这个试验只存在两种结果,则称其为伯努利试验。

随机变量

对于有现实世界意义的数,我们根据意义的不同,将其划分为不同的类,而对于同一类的数,都使用同一个随机变量来称呼。比如,x年x月x日下雨量,我们就可以使用“随机变量X”来称呼;x年x月x日下雨可能性,我们就用“随机变量Y”来称呼。

需要明确的是:

  • 随机变量是一类有相同意义的数,而不是某个数
  • 当使用随机变量作为一个数时,我们需要指定这个随机变量。比如“2017年1月25日下雨量”在数学上才是一个具体的值。
  • 随机变量不一定能用除一一映射以外的方式拟合

几何分布

对于重复n次的伯努利试验,我们可以计算“首次为1是出现在第K次试验”:\({P_k} = p{q^{(k – 1)}}\)
如果一个… Read the rest

前言

本来想写一个关于感知机的总结,但如果要深入探讨,涉及的东西实在太多。仅仅浅尝辄止的话,那我就相当于照搬原文,违背了我写文章的初衷。

所以就单纯地把我自己写的感知机实现代码发上来,辅助大家学习。
我还提供了一个数据生成器,可以生成训练模型所需要的数据。

简单地对结果做了可视化,具体绘制代码见文末提供的github地址。跪求star=v=

感知机模型

感知机算法用于计算得到划分可二分数据集的超平面S。

我们定义优化函数为损失函数:
L=误分类点到超平面S的距离和

\(d = \frac{1}{{\left| w \right|}}|w \bullet {x_i} + b|\)

\(L = – \sum\limits_N {{y_i}} (w \bullet {x_i} + b)\)

采用随机梯度下降算法

\(\frac{{dL}}{{dw}} = – \sum\limits_N {{y_i}} {x_i}\)

故对于每一个误分类点

\(w = w + \eta {y_i}{x_i}\)

算法流程

输入:w, b;
训练:f(x)=sign(wx+b)

  1. 选取初值w0, b0
Read the rest

问题背景

  1. 我使用OneNote写总结。
  2. 在总结数论相关的算法时,文章会包含数学公式。
  3. 数学公式是MS特有的格式。
  4. 直接将OneNote复制到WordPress会导致几乎所有格式的丢失,数学公式无法显示

解决经历

  1. 尝试从OneNote导出。
    只支持导出doc和pdf
    1. 导出doc
      doc效果很好,但不能直接复制到WordPress中
    2. 导出pdf
      pdf效果很好,但唯一能插入到WordPress的方法是作为附件插入。即使安装了增强插件,也只是能将pdf显示出来。这样带来的问题是,搜索引擎无法抓取,显示效果也不好。

    3. 导出MS公式
      见后文

  2. 从word作为起点
    word可以导出的格式就有很多了,包括.html、.mht。

    1. 导出.html
      和pdf类似,无法作为文章一部分显示。
    2. 导出.mht
      和pdf类似,无法作为文章一部分显示。

    3. 通过Word,调用Server的PRC远程过程调用接口
      见后文

Word的“发布到博客功能”

在比较早的时候,WordPress可以设置启用xml-prc远程发布,现在应该是默认开启这个功能了。

但我在使用Word发布的时候出现了下图的情况:
WprdPress Math 1

经过WireShark抓包,大致原因是一段时间后Client端的… Read the rest

前言

本文浅析了SSL和SSH加密原理,分为加密基本知识和SSL/SSH协议内容两部分。

本文不涉及具体非对称加密算法。同时由于资料的零碎,虽然我尽量让文章有结构,但也难免有地方不太完美,请读者多多包涵。

基本知识

信息传递的三大风险

所有信息明文传播,都有三大风险。1

1. 窃听风险(eavesdropping):第三方可以获知通信内容。  
2. 篡改风险(tampering):第三方可以修改通信内容。  
3. 冒充风险(pretending):第三方可以冒充他人身份参与通信。

通过在传递源端(Client端)和目的端(Server端)的秘钥加密(假设其他所有人都不能解密信息),可以避免窃听风险和篡改风险:

1. 所有信息都是加密传播,第三方无法窃听。
2. 信息的末尾使用校验码,并和信息一同加密。如果密文被添加、删除或替换字段,校验码会不匹配。

对称加密和非对称加密

1976年以前,所有的加密方法都是同一种模式:
(1)甲方选择某一种加密规则,对信息进行加密;
(2)乙方使用同一种规则,对信息进行解密。

由于加密和解密使用同样规则(简称”密钥”)… Read the rest

重点

内存连续分配的三种方式,及可变分区分配的五种分配算法。 
内存离散分配的三种方式,分页管理涉及的页表、地址变换和快表。

程序的执行步骤

源程序需要经过编译、链接和装入之后,才能被处理器运行。
os6 1

在程序装入内存前,装入模块中给出的程序地址为程序的逻辑地址或相对地址。一个用户作业的所有装入模块的逻辑地址集合称为该作业的逻辑地址空间。
当用户作业被装入内存后,操作系统的存储管理器会通过名为地址变换/地址重定位的操作,将逻辑地址转换为物理地址。

Note:下面的“链接”和“装入”部分推荐先跳过,先看内存的连续分配和离散分配。

链接

  1. 静态链接
    若干个模块被依次链接成一个大模块
  2. 装入时动态链接
    说是在装入内存时,采用边装入边链接的链接方式。 那逻辑地址怎么确定呢?那如果装入时使用的静态重定位,那岂不是同时确定逻辑地址和物理地址?感觉怪怪的。
  3. 运行时动态链接
    连接过程被推迟到程序运行时进行,使用到才链接。

Note:不是很能理解模块和链接这两个词的意思。也没有在网上找到比较深入的解释,基本都是照本宣科。

装入

  1. 绝对装入
    直接将源程序放入内存即可,不对地址做任何变换。这要求程序员在编程时熟悉内存的使用状况。
    使用环境是单道批处理系统(单个程序进入计算机系
Read the rest