2020年5月 – 小马哥

2020-05-28

php pack()函数详解与示例

转自网络

pack和unpack在一般的程序中还真的不容易见到，但是如果你用过很久以前的php生成excel你就会知道了。他的excel的头就是pack出来的
最近在尝试与C交互的时候又用上了这玩意，所以不得不再看看。其实就是C要求我一定要有包头。。。其实纯字符串也不错嘛。干嘛非得搞个包头呢？真纠结 .。

手册上有pack与unpack的介绍，但都是英文的。。。

任何一款拥有socket操作能力的语言都有一个专门用于组包的函数，php也不例外!

用了很久php了却很少有机会用php进行一些二进制操作。最近用php写一个socket客户端连接一个用C++语言开发的游戏服务端。服务器端开发人员使用了二进制的形式来定义协议的格式。协议格式如下：

包头(2bytes)+加密(1byte)+命令码(2bytes)+帧内容

1.包头的内容是记录帧内容的长度;
2. 加密:0表示不加密，1表示加密；
3. 命令码为服务端命令识别符号；

一开始不了解php原来有pack可以来组装二进制包, 走了弯路，让服务端开发人员用C语言帮忙开发了的几个内存操作函数，按照协议规则返回二进制包，然后我将这几个方法编译成一组扩展函数供php使用。

话归正题，本文是介绍如何使用pack和unpack这两个方法的。php官方手册举例太少，不能很容易理解，特别是那些格式化参数的使用。

转摘的参数中文说明：

pack/unpack 的摸板字符字符含义
a 一个填充空的字节串
A 一个填充空格的字节串
b 一个位串，在每个字节里位的顺序都是升序
B 一个位串，在每个字节里位的顺序都是降序
c 一个有符号 char（8位整数）值
C 一个无符号 char（8位整数）值；关于 Unicode 参阅 U
d 本机格式的双精度浮点数
f 本机格式的单精度浮点数
h 一个十六进制串，低四位在前
H 一个十六进制串，高四位在前
i 一个有符号整数值，本机格式
I 一个无符号整数值，本机格式
l 一个有符号长整形，总是 32 位
L 一个无符号长整形，总是 32 位
n 一个 16位短整形，“网络”字节序（大头在前）
N 一个 32 位短整形，“网络”字节序（大头在前）
p 一个指向空结尾的字串的指针
P 一个指向定长字串的指针
q 一个有符号四倍（64位整数）值
Q 一个无符号四倍（64位整数）值
s 一个有符号短整数值，总是 16 位
S 一个无符号短整数值，总是 16 位，字节序跟机器芯片有关
u 一个无编码的字串
U 一个 Unicode 字符数字
v 一个“VAX”字节序（小头在前）的 16 位短整数
V 一个“VAX”字节序（小头在前）的 32 位短整数
w 一个 BER 压缩的整数
x 一个空字节（向前忽略一个字节）
X 备份一个字节
Z 一个空结束的（和空填充的）字节串
@ 用空字节填充绝对位置

string pack ( string $format [, mixed $args [, mixed $…]] )

一些规则：
1.每个字母后面都可以跟着一个数字，表示 count（计数），如果 count 是一个 * 表示剩下的所有东西。
2.如果你提供的参数比 $format 要求的少，pack 假设缺的都是空值。如果你提供的参数比 $format 要求的多，那么多余的参数被忽略。

下面还是用例子来说明用法会容易理解一点：

PHP代码

关于Pack:
下面的第一部分把数字值包装成字节：
$out = pack(“CCCC”, 65, 66, 67, 68); # $out 等于”ABCD”
$out = pack(“C4”, 65, 66, 67, 68); # 一样的东西
下面的对 Unicode 的循环字母做同样的事情：
$foo = pack(“U4”, 0x24b6, 0x24b7, 0x24b8, 0x24b9);
下面的做类似的事情，增加了一些空：
$out = pack(“CCxxCC”, 65, 66, 67, 68); # $out 等于 “AB\0\0CD”
打包你的短整数并不意味着你就可移植了：
$out = pack(“s2”, 1, 2);
# 在小头在前的机器上是 “\1\0\2\0”
# 在大头在前的机器上是 “\0\1\0\2”
在二进制和十六进制包装上，count 指的是位或者半字节的数量，而不是生成的字节数量：
$out = pack(“B32”, “…”);
$out = pack(“H8”, “5065726c”); # 都生成“Perl”
a 域里的长度只应用于一个字串：
$out = pack(“a4”, “abcd”, “x”, “y”, “z”); # “abcd”
要绕开这个限制，使用多倍声明：
$out = pack(“aaaa”, “abcd”, “x”, “y”, “z”); # “axyz”
$out = pack(“a” x 4, “abcd”, “x”, “y”, “z”); # “axyz”
a 格式做空填充：
$out = pack(“a14”, “abcdefg”); # ” abcdefg\0\0\0\0\0\0″
关于unpack:
array unpack ( string $format, string $data )
$data = “010000020007”;
unpack(“Sint1/Cchar1/Sint2/Cchar2”,$data);
## array(‘int1’=>1, ‘char1’=>’0’,’int2’=>2,’char2’=>7);
最后本文开头讲到的协议使用pack/unpack 举例程序代码为：
$lastact = pack(‘SCSa32a32’,0x0040, 0x00, 0x0006, $username, $passwd )；
unpack(‘Sint1/Cchar1/Sint2/Cchar2/’,$lastmessage)；

学习资料：
http://blog.csdn.net/jojobb3138688/archive/2007/05/07/1598609.aspx

我上面的内容来自于：http://blog.sina.com.cn/s/blog_3eba8f1c0100nq9r.html，我现在已经顺利的使用完了。黑黑
还有的参考资料：
http://bbs.phpchina.com/thread-104492-1-1.html
http://hi.baidu.com/chinetman/item/f78a71d847e7d638e2108fda

2020-05-26

epoll讲解

转自知乎

首先我们来定义流的概念，一个流可以是文件，socket，pipe等等可以进行I/O操作的内核对象。

不管是文件，还是套接字，还是管道，我们都可以把他们看作流。

之后我们来讨论I/O的操作，通过read，我们可以从流中读入数据；通过write，我们可以往流写入数据。现在假定一个情形，我们需要从流中读数据，但是流中还没有数据，（典型的例子为，客户端要从socket读如数据，但是服务器还没有把数据传回来），这时候该怎么办？

阻塞：阻塞是个什么概念呢？比如某个时候你在等快递，但是你不知道快递什么时候过来，而且你没有别的事可以干（或者说接下来的事要等快递来了才能做）；那么你可以去睡觉了，因为你知道快递把货送来时一定会给你打个电话（假定一定能叫醒你）。

非阻塞忙轮询：接着上面等快递的例子，如果用忙轮询的方法，那么你需要知道快递员的手机号，然后每分钟给他挂个电话：“你到了没？”

很明显一般人不会用第二种做法，不仅显很无脑，浪费话费不说，还占用了快递员大量的时间。

大部分程序也不会用第二种做法，因为第一种方法经济而简单，经济是指消耗很少的CPU时间，如果线程睡眠了，就掉出了系统的调度队列，暂时不会去瓜分CPU宝贵的时间片了。

为了了解阻塞是如何进行的，我们来讨论缓冲区，以及内核缓冲区，最终把I/O事件解释清楚。缓冲区的引入是为了减少频繁I/O操作而引起频繁的系统调用（你知道它很慢的），当你操作一个流时，更多的是以缓冲区为单位进行操作，这是相对于用户空间而言。对于内核来说，也需要缓冲区。

假设有一个管道，进程A为管道的写入方，Ｂ为管道的读出方。

假设一开始内核缓冲区是空的，B作为读出方，被阻塞着。然后首先A往管道写入，这时候内核缓冲区由空的状态变到非空状态，内核就会产生一个事件告诉Ｂ该醒来了，这个事件姑且称之为“缓冲区非空”。

但是“缓冲区非空”事件通知B后，B却还没有读出数据；且内核许诺了不能把写入管道中的数据丢掉这个时候，Ａ写入的数据会滞留在内核缓冲区中，如果内核也缓冲区满了，B仍未开始读数据，最终内核缓冲区会被填满，这个时候会产生一个I/O事件，告诉进程A，你该等等（阻塞）了，我们把这个事件定义为“缓冲区满”。

假设后来Ｂ终于开始读数据了，于是内核的缓冲区空了出来，这时候内核会告诉A，内核缓冲区有空位了，你可以从长眠中醒来了，继续写数据了，我们把这个事件叫做“缓冲区非满”

也许事件Y1已经通知了A，但是A也没有数据写入了，而Ｂ继续读出数据，知道内核缓冲区空了。这个时候内核就告诉B，你需要阻塞了！，我们把这个时间定为“缓冲区空”。

这四个情形涵盖了四个I/O事件，缓冲区满，缓冲区空，缓冲区非空，缓冲区非满（注都是说的内核缓冲区，且这四个术语都是我生造的，仅为解释其原理而造）。这四个I/O事件是进行阻塞同步的根本。（如果不能理解“同步”是什么概念，请学习操作系统的锁，信号量，条件变量等任务同步方面的相关知识）。

然后我们来说说阻塞I/O的缺点。但是阻塞I/O模式下，一个线程只能处理一个流的I/O事件。如果想要同时处理多个流，要么多进程(fork)，要么多线程(pthread_create)，很不幸这两种方法效率都不高。

于是再来考虑非阻塞忙轮询的I/O方式，我们发现我们可以同时处理多个流了（把一个流从阻塞模式切换到非阻塞模式再此不予讨论）：

while true {

for i in stream[]; {

if i has data

read until unavailable

}

我们只要不停的把所有流从头到尾问一遍，又从头开始。这样就可以处理多个流了，但这样的做法显然不好，因为如果所有的流都没有数据，那么只会白白浪费CPU。这里要补充一点，阻塞模式下，内核对于I/O事件的处理是阻塞或者唤醒，而非阻塞模式下则把I/O事件交给其他对象（后文介绍的select以及epoll）处理甚至直接忽略。

为了避免CPU空转，可以引进了一个代理（一开始有一位叫做select的代理，后来又有一位叫做poll的代理，不过两者的本质是一样的）。这个代理比较厉害，可以同时观察许多流的I/O事件，在空闲的时候，会把当前线程阻塞掉，当有一个或多个流有I/O事件时，就从阻塞态中醒来，于是我们的程序就会轮询一遍所有的流（于是我们可以把“忙”字去掉了）。代码长这样:

while true {

select(streams[])

for i in streams[] {

if i has data

read until unavailable

}

于是，如果没有I/O事件产生，我们的程序就会阻塞在select处。但是依然有个问题，我们从select那里仅仅知道了，有I/O事件发生了，但却并不知道是那几个流（可能有一个，多个，甚至全部），我们只能无差别轮询所有流，找出能读出数据，或者写入数据的流，对他们进行操作。

但是使用select，我们有O(n)的无差别轮询复杂度，同时处理的流越多，没一次无差别轮询时间就越长。再次

说了这么多，终于能好好解释epoll了

epoll可以理解为event poll，不同于忙轮询和无差别轮询，epoll之会把哪个流发生了怎样的I/O事件通知我们。此时我们对这些流的操作都是有意义的。（复杂度降低到了O(1)）

在讨论epoll的实现细节之前，先把epoll的相关操作列出：

epoll_create 创建一个epoll对象，一般epollfd = epoll_create()

epoll_ctl （epoll_add/epoll_del的合体），往epoll对象中增加/删除某一个流的某一个事件

比如

epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN);//注册缓冲区非空事件，即有数据流入

epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT);//注册缓冲区非满事件，即流可以被写入

epoll_wait(epollfd,…)等待直到注册的事件发生

（注：当对一个非阻塞流的读写发生缓冲区满或缓冲区空，write/read会返回-1，并设置errno=EAGAIN。而epoll只关心缓冲区非满和缓冲区非空事件）。

一个epoll模式的代码大概的样子是：

while true {

active_stream[] = epoll_wait(epollfd)

for i in active_stream[] {

read or write till

}

限于篇幅，我只说这么多，以揭示原理性的东西，至于epoll的使用细节，请参考man和google，实现细节，请参阅linux kernel source。

2020-05-22

chsh 查看和修改当前登录的Shell

chsh 命令本身并不复杂，它的功能比较单一，就是负责查看（显示）和修改我们系统的登录 Shell。想修改登录 Shell，首先要知道我们的系统安装了哪些 Shell。这里有两种方法可以查看。

方法一：（mac 下不行）

[roc@roclinux ~]$ chsh -l
/bin/sh
/bin/bash
/sbin/nologin
/bin/zsh

方法二：（mac下可以）

[roc@roclinux ~]$ cat /etc/shells
/bin/sh
/bin/bash
/sbin/nologin
/bin/zsh
mac:
maxianwideMBP57:home maxianwei$ cat /etc/shells
# List of acceptable shells for chpass(1).
# Ftpd will not allow users to connect who are not using
# one of these shells.

/bin/bash
/bin/csh
/bin/ksh
/bin/sh
/bin/tcsh
/bin/zsh

其实chsh -l命令本质上也是去查看 /etc/shells 文件。

查看当前正在使用的 Shell

使用一个环境变量，就可以查看到当前正在使用的 Shell 啦：

[roc@roclinux ~]$ echo $SHELL
/bin/bash

maxianwideMBP57:home maxianwei$ echo $SHELL
/bin/bash

注意：SHELL一定要大写。可以看到，我们目前使用的 Shell 是 bash。

听说 zsh 不错，于是我们就通过在命令行执行 zsh 命令切换到了 zsh 环境。可是，为什么查看当前 Shell 类型仍然是 /bin/bash 呢？

[roc@roclinux ~]$ zsh
[roc@roclinux]~% echo $SHELL
/bin/bash
[roc@roclinux]~%

请注意，我们虽然执行了 zsh，但是所谓“当前的 Shell”是一个大环境的概念，是针对一个已登录的用户而言的。而我们执行 zsh 只是启动了一个 zsh 的解释器程序而已，并没有改变大环境。如果想改变“当前的 Shell”，那么还是要求助于 chsh 才可以。

将 Shell 环境真正切换到 zsh

[roc@roclinux ~]$ chsh -s /bin/zsh
Changing shell for roc.
Password:
Shell changed.

使用 chsh 命令的-s选项就可以修改登录的 Shell 了。

如果我们这时候满怀欣喜地执行 echo $SHELL，就会发现然输出的仍是 /bin/bash。这是因为 chsh 改变的是我们登录 Shell 的配置，我们必须退出再重新登录 Shell，才可以完全投入到 zsh 的怀抱。

真是一波三折，退出并重新登录后，终于看到了我们想要的 /bin/zsh 了：

[roc@roclinux]~% echo $SHELL
/bin/zsh

chsh -s 到底修改了哪里

chsh -s其实修改的就是 /etc/passwd 文件中和我们所登录的用户名相对应的那一行。现在我们来查看一下：

[roc@roclinux]~% cat /etc/passwd|grep ^roc
roc:x:1001:1001::/home/roc:/bin/zsh

可以发现，输出内容的最后部分已经变成了 /bin/zsh 了。重启系统的时候，Linux 就会读取这一命令来启动新的 Shell。

好了，我们要恢复正常的工作环境，把 Shell 修改回我们熟悉的 /bin/bash 了：

[roc@roclinux]~% chsh -s /bin/bash
Changing Shell for roc.
Password:
Shell changed.

2020-05-08

linux 查找删除指定日期文件

find ./ -maxdepth 1 -name “a*” -mtime +2 -exec rm -rfv {} \;

参考：

https://www.cnblogs.com/tianruixue/p/5845070.html

https://www.cnblogs.com/wuning/p/11778348.html