软件开发技术 - 清风小筑

远程桌面（RDP）默认使用的是 CPU 模拟的显示，性能很低，在使用大型软件（如 Photoshop）时便会很吃力。之前网上的说法都是通过策略组中的 “计算机配置->管理模板->Windows组件->远程桌面服务->远程桌面会话主机->远程会话环境” 中的 “将硬件图形适配器应用于所有远程桌面服务会话” 配置启动，但是没有作用。

正确的方法是除了打开以上的配置之外，还需要开启显卡支持，因为显卡商考虑到利润，不会让你共享显卡，好在疫情原因让 nVidia 压力山大，于是勉强在开发者论坛放了一个设置工具，下载链接：https://developer.nvidia.com/nvidia-opengl-rdp，这个链接需要注册成开发者才能访问，下载后执行重启计算机就可以了。至于 AMD 显卡，可能也有类型的工具，目前我还没有找到。

开启 UDP 连接可以提升远程桌面的响应能力，只需要修改注册表，方法为用管理员模式打开注册表，然后运行如下命令：

Set-ItemProperty 'HKLM:/Software/Policies/Microsoft/Windows NT/Terminal Services/Client' 'fClientDisableUDP' 0

UDP 使用的端口亦为 3389，如果你在 NAT 后面，别忘了做端口映射。

评论(1) 引用(0) 浏览(10992) 分类：软件开发技术

17

Jun
2021

一种数组压缩算法

标签: 算法

我们在开发中后台应用或者中间件的时候，会存储一些数据在内存中以加快访问速度。随着数据量的增加，除了可以放置于堆外，还可以通过实时压缩来缓解。今天就给大家介绍一种压缩整形数组的方式

数组指 long[] 或者 int[] 类型，主要用来存索引数据。当数据量变大时，首先想到的就是缩减每个数字占用的空间，因为我们都知道一个 long 类型是占 8 个字节，而 int 也是占用 4 个字节。就以正数而言，int 3 个字节以上表示 2^24 = 16M 即 1600 百万以上的数字，一般我们是用不到的，大多数情况下高位都是闲置着的，所以可以将高位去掉，只存储用到的那几个字节（见图1）。当然为了可以还原，我们需要记录这个数字到底使用了几位。这里有两种方式：一是借用几位来表示，就拿 long 来说，我们只需要借用 3 位就可以表示用到的字节数了，另一方面，2^60 以后已经是非常大的数了，几乎用不到，所以我们借用也不会产生额外的效果；另一种就是利用字节最高位表示还有剩余数据（见图2）。这样一来，我们就把 long 或者 int 数组压缩成了 byte 数组，里面所有用到的字节都是有表示意义的。

图1

图2

这样一样我们就可以顺利地将数字进行压缩与解压缩了，在传输场景下可以很好的解决空间问题，这都是常见的思路。但是如果我们需要压缩后的数组仍然具备下标访问的能力怎么办？之前每个数字都是固定长度，我们可以通过 [单个数字占用的字节数]*[下标] 很快地找到对应的地址，但是压缩过后每个数字占用的空间不是一样的，这种方式就失效了。如果我们要取下标为 200 的数据，那我们就得线性查找 200 次？那么时间复杂度就由 O(1) 下降为了 O(n)。有没有更好的办法呢？当然是有的。我们可以建立索引（图3），即：

将数字分为若干个桶，每个桶的大小可心调节
我们使用另一个数组，大小为桶的数量，存储每个桶所第一个数据所在的下标
在查找时我首先使用二分查找到对应的桶，再使用线性查找到对应的数据

图3

由于在桶内是线性查找，因此不会太大，一般是 1KB 或者 4 KB。这样一来，我们查找速度就可以大大提升，接近 O(logn)。使用这套方式，经测试，在 4 亿随机数据的情况占用的空间可以缩减 30% 左右，但这并不是终点。利用桶的性质，我们可以只在桶内第一个元素存原数字，后面的都存一个偏移量，因为当数据不会明显离散（即一会儿是十几，一会是几十亿那种），可以很好地缩减数据大小，比如两个数都占用了 3 个字节，存偏移量后，第二个数字就可以使用 1~2 个字节来表示了。当然如果你对数组本身的顺序没有要求的话，还可以先对数组进行排序，这种偏移量的效果就可以暴表了。最理想的情况下，可以压缩至原来的 30%。

测试压缩效果（未排序）

UPDATE:2021-06-20

这里还有优化空间，之前采用二分查找是因数我们采用定长的桶，每个桶存储的数字数量不定，但如果我们采用变长桶，让每个桶存储 N 个数，那么，便可以直接通过 “整除+求余” 的方式快速打到数所在的桶，查询效率进一步提升。

源码：seflerZ/zipped-num-array: Compressed number array and acts exactly like the original array like long[] and int[] (github.com)

评论(0) 引用(0) 浏览(2949) 分类：软件开发技术

21

Feb
2021

几行命令，让你的 Windows 拥有全能解压软件

首先你需要安装 WSL，最好是 Ubuntu，然后在 WSL 建立以下脚本：

#! /bin/bash

FILE=$1
FILE=${FILE##*\\}
EXT=${FILE##*.}
NAME=${FILE%%.*}

#echo $FILE >> ./filename
#echo $EXT >> ./filename
#echo $NAME >> ./filename

#echo $FILE >> ./filename

if [ $EXT = "zip" ]; then
        unzip "$FILE"
elif [ $EXT = "tgz" ]; then
        tar -xzvf "$FILE"
elif [ $EXT = "gz" ]; then
        gzip -d "$FILE"
elif [ $EXT = "rar" ]; then
        unrar x -ad "$FILE"
else
        echo "not supported"
fi

sleep 2

然后在 Ubuntu 中安装 unrar, zip, tar 等工具用于解压。之后就是在 Windows 注册表，路径为 \HKEY_CLASSES_ROOT\*\shell，在shell上点击右键->新建->项，命名为解压至当前目录（随便命名），在刚才那个目录上点击右键->新建->项，命名为command（必须这个名），再新建一个字符串，输入值为：wsl exec sh ~/unzip.sh "%1"，其中 ~/unzip.sh 是第一个脚本在 wsl 中的路径，我这里放置在了 home 目录。如果还不明白如何新建右键菜单可以参考这个文章

评论(0) 引用(0) 浏览(2758) 分类：软件开发技术

12

Sep
2019

浅谈神经网络与机器学习

标签: 机器学习

发展历史

说到机器学习，大家听闻最多的就要数 “深度学习” 这么一个概念了，近几年比较火。深度学习其实就是机器学习的一新方法论合集，不过机器学习的研究上世纪就开始了，特别是深度学习的基础 “人工神经元网络（以下简称神经网络）” 更是于 1943 年就由心理学家 Warren McCulloch 和数学家 Walter Pitts 提出了。在经历了快速发展后陷入瓶颈期，最重要的一点便是无法有效地训练神经网络——一方便是算法，另一方面是计算能力——直到上世纪未才由反向传播（BP）方式得以改进。

神经网络就是模拟生物大脑的信息传递结构，以计算机的视角进行了构建，参照生物神经元的特性，也分为神经元、轴突与树突，具体由计算机图数据结构来表示。例如一个简单的神经元网络如下:

前馈人工神经元网络

阅读全文>>

评论(0) 引用(0) 浏览(6542) 分类：软件开发技术

15

May
2019

我的书出版了！Service Mesh： Istio 入门必备

标签: 思考软件设计架构

很长时间没有写博客了，大家可能以为它已经废弃了。其实，从去年到现在我都是在忙着写一本关于 Istio 的书籍，之所以写这本书主要还是因为当时市面上对这方面的文章太少了，书籍则是零。因此我将自己的理解与实践经验分享给大家，希望对大家有帮助。

我个人是非常看好服务网格的，我自己本身专注于软负载，我认为服务网格是在容器时代的软负载最佳的存在形态。就像 PaaS 一样，服务网格也将自己作为一个基础通用服务层下层到了基础技术栈体系，这样不仅有利于通用性，还对业务的无侵入性有很好的支持。在容器时代，一切都是浮动的、弹性的，可变的，负载也不例外，从早些时候的硬件负载，到微服务时代的透明负载，再到服务网格，这一个世代的划分。我觉得每个对分布式有兴趣或者从事其中的工程师都应该或多或少了解下。

有兴趣吗？买我一本书吧，听我慢慢为你道来~

当当：http://product.dangdang.com/27857036.html