Docker 运行官方 MySQL 镜像无法远程连接的坑

发表于 2018-11-21

字数统计: 239 | 阅读时长 ≈ 1

使用 Docker 官方提供的 MySQL 镜像进行安装、建立容器（必须指定端口映射和 root 口令）。

1 2	docker pull mysql:latest docker run -p 9527:3306 -e MYSQL_ROOT_PASSWORD=root -d mysql

但此时如果直接远程连接该容器中的 MySQL 并输入口令后，则会出现报错信息：

1	ERROR 2059 (HY000): Authentication plugin 'caching_sha2_password' cannot be loaded: /usr/lib64/mysql/plugin/caching_sha2_password.so: cannot open shared object file: No such file or directory

根据报错信息，连接失败原因为口令使用了 caching_sha2_password 方式进行加密，通过 SELECT user, host, plugin, authentication_string FROM user WHERE user='root'; 查询可以看到 root 用户的口令确实是使用 caching_sha2_password 方式进行加密，而客户端找不到 caching_sha2_password 插件，因此连接失败。

根据官方文档，可以将加密方式更改为 mysql_native_password。通过 ALTER USER 'root'@'%' IDENTIFIED WITH mysql_native_password BY 'root'; 将 root 用户的口令加密方式更改为 mysql_native_password，在远程即可正常连接 MySQL。

more、less 和 most 的区别

发表于 2018-11-19

字数统计: 1.9k | 阅读时长 ≈ 6

如果你是一个 Linux 方面的新手，你可能会在 more、less、most 这三个命令行工具之间产生疑惑。在本文当中，我会对这三个命令行工具进行对比，以及展示它们各自在 Linux 中的一些使用例子。总的来说，这几个命令行工具之间都有相通和差异，而且它们在大部分 Linux 发行版上都有自带。

我们首先来看看 more 命令。

more 命令

more 是一个老式的、基础的终端分页阅读器，它可以用于打开指定的文件并进行交互式阅读。如果文件的内容太长，在一屏以内无法完整显示，就会逐页显示文件内容。使用回车键或者空格键可以滚动浏览文件的内容，但有一个限制，就是只能够单向滚动。也就是说只能按顺序往下翻页，而不能进行回看。

更正

有的 Linux 用户向我指出，在 more 当中是可以向上翻页的。不过，最原始版本的 more 确实只允许向下翻页，在后续出现的较新的版本中也允许了有限次数的向上翻页，只需要在浏览过程中按 b 键即可向上翻页。唯一的限制是 more 不能搭配管道使用（如 ls | more）。（LCTT 译注：此处原作者疑似有误，译者使用 more 是可以搭配管道使用的，或许与不同 more 版本有关）

按 q 即可退出 more。

更多示例

打开 ostechnix.txt 文件进行交互式阅读，可以执行以下命令：

1	$ more ostechnix.txt

在阅读过程中，如果需要查找某个字符串，只需要像下面这样输入斜杠（/）之后接着输入需要查找的内容：

/linux

按 n 键可以跳转到下一个匹配的字符串。

如果需要在文件的第 10 行开始阅读，只需要执行：

1	$ more +10 file

就可以从文件的第 10 行开始显示文件的内容了。

如果你需要让 more 提示你按空格键来翻页，可以加上 -d 参数：

1	$ more -d ostechnix.txt

如上图所示，more 会提示你可以按空格键翻页。

如果需要查看所有选项以及对应的按键，可以按 h 键。

要查看 more 的更多详细信息，可以参考手册：

1	$ man more

less 命令

less 命令也是用于打开指定的文件并进行交互式阅读，它也支持翻页和搜索。如果文件的内容太长，也会对输出进行分页，因此也可以翻页阅读。比 more 命令更好的一点是，less 支持向上翻页和向下翻页，也就是可以在整个文件中任意阅读。

在使用功能方面，less 比 more 命令具有更多优点，以下列出其中几个：

支持向上翻页和向下翻页
支持向上搜索和向下搜索
可以跳转到文件的末尾并立即从文件的开头开始阅读
在编辑器中打开指定的文件

更多示例

打开文件：

1	$ less ostechnix.txt

按空格键或回车键可以向下翻页，按 b 键可以向上翻页。

如果需要向下搜索，在输入斜杠（/）之后接着输入需要搜索的内容：

/linux

按 n 键可以跳转到下一个匹配的字符串，如果需要跳转到上一个匹配的字符串，可以按 N 键。

如果需要向上搜索，在输入问号（?）之后接着输入需要搜索的内容：

?linux

同样是按 n 键或 N 键跳转到下一个或上一个匹配的字符串。

只需要按 v 键，就会将正在阅读的文件在默认编辑器中打开，然后就可以对文件进行各种编辑操作了。

按 h 键可以查看 less 工具的选项和对应的按键。

按 q 键可以退出阅读。

要查看 less 的更多详细信息，可以参考手册：

1	$ man less

most 命令

most 同样是一个终端阅读工具，而且比 more 和 less 的功能更为丰富。most 支持同时打开多个文件。你可以在打开的文件之间切换、编辑当前打开的文件、迅速跳转到文件中的某一行、分屏阅读、同时锁定或滚动多个屏幕等等功能。在默认情况下，对于较长的行，most 不会将其截断成多行显示，而是提供了左右滚动功能以在同一行内显示。

更多示例

打开文件：

1	$ most ostechnix1.txt

按 e 键可以编辑当前文件。

如果需要向下搜索，在斜杠（/）或 S 或 f 之后输入需要搜索的内容，按 n 键就可以跳转到下一个匹配的字符串。

如果需要向上搜索，在问号（?）之后输入需要搜索的内容，也是通过按 n 键跳转到下一个匹配的字符串。

同时打开多个文件：

1	$ most ostechnix1.txt ostechnix2.txt ostechnix3.txt

在打开了多个文件的状态下，可以输入 :n 切换到下一个文件，使用 ↑ 或 ↓ 键选择需要切换到的文件，按回车键就可以查看对应的文件。

要打开文件并跳转到某个字符串首次出现的位置（例如 linux），可以执行以下命令：

1	$ most file +/linux

按 h 键可以查看帮助。

按键操作列表

移动：

空格键或 D 键 – 向下滚动一屏
DELETE 键或 U 键 – 向上滚动一屏
↓ 键 – 向下移动一行
↑ 键 – 向上移动一行
T 键 – 移动到文件开头
B 键 – 移动到文件末尾
> 键或 TAB 键 – 向右滚动屏幕
< 键 – 向左滚动屏幕
→ 键 – 向右移动一列
← 键 – 向左移动一列
J 键或 G 键 – 移动到某一行，例如 10j 可以移动到第 10 行
% 键 – 移动到文件长度某个百分比的位置

窗口命令：

Ctrl-X 2、Ctrl-W 2 – 分屏
Ctrl-X 1、Ctrl-W 1 – 只显示一个窗口
O 键、Ctrl-X O – 切换到另一个窗口
Ctrl-X 0 – 删除窗口

文件内搜索：

S 键或 f 键或 / 键 – 向下搜索
? 键 – 向上搜索
n 键 – 跳转到下一个匹配的字符串

退出：

q 键 – 退出 most ，且所有打开的文件都会被关闭
:N、:n – 退出当前文件并查看下一个文件（使用 ↑ 键、↓ 键选择下一个文件）

要查看 most 的更多详细信息，可以参考手册：

1	$ man most

总结

more – 传统且基础的分页阅读工具，仅支持向下翻页和有限次数的向上翻页。

less – 比 more 功能丰富，支持向下翻页和向上翻页，也支持文本搜索。在打开大文件的时候，比 vi 这类文本编辑器启动得更快。

most – 在上述两个工具功能的基础上，还加入了同时打开多个文件、同时锁定或滚动多个屏幕、分屏等等大量功能。

以上就是我的介绍，希望能让你通过我的文章对这三个工具有一定的认识。如果想了解这篇文章以外的关于这几个工具的详细功能，请参阅它们的 man 手册。

via: https://www.ostechnix.com/the-difference-between-more-less-and-most-commands/

gitbase：用 SQL 查询 Git 仓库

发表于 2018-11-19

字数统计: 1.2k | 阅读时长 ≈ 4

gitbase 是一个使用 go 开发的的开源项目，它实现了在 Git 仓库上执行 SQL 查询。

Git 已经成为了代码版本控制的事实标准，但尽管 Git 相当普及，对代码仓库的深入分析的工作难度却没有因此而下降；而 SQL 在大型代码库的查询方面则已经是一种久经考验的语言，因此诸如 Spark 和 BigQuery 这样的项目都采用了它。

所以，source{d} 很顺理成章地将这两种技术结合起来，就产生了 gitbase（LCTT 译注：source{d} 是一家开源公司，本文作者是该公司开发者关系副总裁）。gitbase 是一个代码即数据code-as-data的解决方案，可以使用 SQL 对 git 仓库进行大规模分析。

gitbase 是一个完全开源的项目。它站在了很多巨人的肩上，因此得到了足够的发展竞争力。下面就来介绍一下其中的一些“巨人”。

gitbase playground 为 gitbase 提供了一个可视化的操作环境。

用 Vitess 解析 SQL

gitbase 通过 SQL 与用户进行交互，因此需要能够遵循 MySQL 协议来对通过网络传入的 SQL 请求作出解析和理解，万幸由 YouTube 建立的 Vitess 项目已经在这一方面给出了解决方案。Vitess 是一个横向扩展的 MySQL 数据库集群系统。

我们只是使用了这个项目中的部分重要代码，并将其转化为一个可以让任何人在数分钟以内编写出一个 MySQL 服务器的开源程序，就像我在 justforfunc 视频系列中展示的 CSVQL 一样，它可以使用 SQL 操作 CSV 文件。

用 go-git 读取 git 仓库

在成功解析 SQL 请求之后，还需要对数据集中的 git 仓库进行查询才能返回结果。因此，我们还结合使用了 source{d} 最成功的 go-git 仓库。go-git 是使用纯 go 语言编写的具有高度可扩展性的 git 实现。

借此我们就可以很方便地将存储在磁盘上的代码仓库保存为 siva 文件格式（这同样是 source{d} 的一个开源项目），也可以通过 git clone 来对代码仓库进行复制。

使用 enry 检测语言、使用 babelfish 解析文件

gitbase 集成了我们开源的语言检测项目 enry 以及代码解析项目 babelfish，因此在分析 git 仓库历史代码的能力也相当强大。babelfish 是一个自托管服务，普适于各种源代码解析，并将代码文件转换为通用抽象语法树Universal Abstract Syntax Tree（UAST）。

这两个功能在 gitbase 中可以被用户以函数 LANGUAGE 和 UAST 调用，诸如“查找上个月最常被修改的函数的名称”这样的请求就需要通过这两个功能实现。

提高性能

gitbase 可以对非常大的数据集进行分析，例如来自 GitHub 高达 3 TB 源代码的 Public Git Archive（公告）。面临的工作量如此巨大，因此每一点性能都必须运用到极致。于是，我们也使用到了 Rubex 和 Pilosa 这两个项目。

使用 Rubex 和 Oniguruma 优化正则表达式速度

Rubex 是 go 的正则表达式标准库包的一个准替代品。之所以说它是准替代品，是因为它没有在 regexp.Regexp 类中实现 LiteralPrefix 方法，直到现在都还没有。

Rubex 的高性能是由于使用 cgo 调用了 Oniguruma，它是一个高度优化的 C 代码库。

使用 Pilosa 索引优化查询速度

索引几乎是每个关系型数据库都拥有的特性，但 Vitess 由于不需要用到索引，因此并没有进行实现。

于是我们引入了 Pilosa 这个开源项目。Pilosa 是一个使用 go 实现的分布式位图索引，可以显著提升跨多个大型数据集的查询的速度。通过 Pilosa，gitbase 才得以在巨大的数据集中进行查询。

总结

我想用这一篇文章来对开源社区表达我衷心的感谢，让我们能够不负众望的在短时间内完成 gitbase 的开发。我们 source{d} 的每一位成员都是开源的拥护者，github.com/src-d 下的每一行代码都是见证。

你想使用 gitbase 吗？最简单快捷的方式是从 sourced.tech/engine 下载 source{d} 引擎，就可以通过单个命令运行 gitbase 了。

想要了解更多，可以听听我在 Go SF 大会上的演讲录音。

本文在 Medium 首发，并经许可在此发布。

via: https://opensource.com/article/18/11/gitbase

pydbgen：一个数据库随机生成器

发表于 2018-11-17

字数统计: 1.4k | 阅读时长 ≈ 5

用这个简单的工具生成带有多表的大型数据库，让你更好地用 SQL 研究数据科学。

在研究数据科学的过程中，最麻烦的往往不是算法或者技术，而是如何获取到一批原始数据。尽管网上有很多真实优质的数据集可以用于机器学习，然而在学习 SQL 时却不是如此。

对于数据科学来说，熟悉 SQL 的重要性不亚于了解 Python 或 R 编程。如果想收集诸如姓名、年龄、信用卡信息、地址这些信息用于机器学习任务，在 Kaggle 上查找专门的数据集比使用足够大的真实数据库要容易得多。

如果有一个简单的工具或库来帮助你生成一个大型数据库，表里还存放着大量你需要的数据，岂不美哉？

不仅仅是数据科学的入门者，即使是经验丰富的软件测试人员也会需要这样一个简单的工具，只需编写几行代码，就可以通过随机（但是是假随机）生成任意数量但有意义的数据集。

因此，我要推荐这个名为 pydbgen 的轻量级 Python 库。在后文中，我会简要说明这个库的相关内容，你也可以阅读它的文档详细了解更多信息。

pydbgen 是什么

pydbgen 是一个轻量的纯 Python 库，它可以用于生成随机但有意义的数据记录（包括姓名、地址、信用卡号、日期、时间、公司名称、职位、车牌号等等），存放在 Pandas Dataframe 对象中，并保存到 SQLite 数据库或 Excel 文件。

如何安装 pydbgen

目前 1.0.5 版本的 pydbgen 托管在 PyPI（Python 包索引存储库Python Package Index repository）上，并且对 Faker 有依赖关系。安装 pydbgen 只需要执行命令：

1	pip install pydbgen

已经在 Python 3.6 环境下测试安装成功，但在 Python 2 环境下无法正常安装。

如何使用 pydbgen

在使用 pydbgen 之前，首先要初始化 pydb 对象。

1
2
3

import pydbgen
from pydbgen import pydbgen
myDB=pydbgen.pydb()

随后就可以调用 pydb 对象公开的各种内部函数了。可以按照下面的例子，输出随机的美国城市和车牌号码：

myDB.city_real()
>> 'Otterville'
for _ in range(10):
    print(myDB.license_plate())
>> 8NVX937
   6YZH485
   XBY-564
   SCG-2185
   XMR-158
   6OZZ231
   CJN-850
   SBL-4272
   TPY-658
   SZL-0934

另外，如果你输入的是 city() 而不是 city_real()，返回的将会是虚构的城市名。

print(myDB.gen_data_series(num=8,data_type='city'))
>>
New Michelle
Robinborough
Leebury
Kaylatown
Hamiltonfort
Lake Christopher
Hannahstad
West Adamborough

生成随机的 Pandas Dataframe

你可以指定生成数据的数量和种类，但需要注意的是，返回结果均为字符串或文本类型。

1 2	testdf=myDB.gen_dataframe(5,['name','city','phone','date']) testdf

最终产生的 Dataframe 类似下图所示。

生成数据库表

你也可以指定生成数据的数量和种类，而返回结果是数据库中的文本或者变长字符串类型。在生成过程中，你可以指定对应的数据库文件名和表名。

1
2
3

myDB.gen_table(db_file='Testdb.DB',table_name='People',

fields=['name','city','street_address','email'])

上面的例子种生成了一个能被 MySQL 和 SQLite 支持的 .db 文件。下图则显示了这个文件中的数据表在 SQLite 可视化客户端中打开的画面。

生成 Excel 文件

和上面的其它示例类似，下面的代码可以生成一个具有随机数据的 Excel 文件。值得一提的是，通过将 phone_simple 参数设为 False ，可以生成较长较复杂的电话号码。如果你想要提高自己在数据提取方面的能力，不妨尝试一下这个功能。

1 2	myDB.gen_excel(num=20,fields=['name','phone','time','country'], phone_simple=False,filename='TestExcel.xlsx')

最终的结果类似下图所示：

生成随机电子邮箱地址

pydbgen 内置了一个 realistic_email 方法，它基于种子来生成随机的电子邮箱地址。如果你不想在网络上使用真实的电子邮箱地址时，这个功能可以派上用场。

for _ in range(10):
    print(myDB.realistic_email('Tirtha Sarkar'))
>>
Tirtha_Sarkar@gmail.com
Sarkar.Tirtha@outlook.com
Tirtha_S48@verizon.com
Tirtha_Sarkar62@yahoo.com
Tirtha.S46@yandex.com
Tirtha.S@att.com
Sarkar.Tirtha60@gmail.com
TirthaSarkar@zoho.com
Sarkar.Tirtha@protonmail.com
Tirtha.S@comcast.net

未来的改进和用户贡献

目前的版本中并不完美。如果你发现了 pydbgen 的 bug 导致它在运行期间发生崩溃，请向我反馈。如果你打算对这个项目贡献代码，也随时欢迎你。当然现在也还有很多改进的方向：

pydbgen 作为随机数据生成器，可以集成一些机器学习或统计建模的功能吗？
pydbgen 是否会添加可视化功能？

一切皆有可能！

如果你有任何问题或想法想要分享，都可以通过 tirthajyoti@gmail.com 与我联系。如果你像我一样对机器学习和数据科学感兴趣，也可以添加我的 LinkedIn 或在 Twitter 上关注我。另外，还可以在我的 GitHub 上找到更多 Python、R 或 MATLAB 的有趣代码和机器学习资源。

本文以 CC BY-SA 4.0 许可在 Towards Data Science 首发。

via: https://opensource.com/article/18/11/pydbgen-random-database-table-generator

几个用于替代 du 命令的更好选择

发表于 2018-11-16

字数统计: 2.2k | 阅读时长 ≈ 8

大家对 du 命令应该都不陌生，它可以在类 Unix 系统中对文件和目录的空间使用情况进行计算和汇总。如果你也经常需要使用 du 命令，你会对以下内容感兴趣的。我发现了五个可以替代原有的 du 命令的更好的工具。当然，如果后续有更多更好的选择，我会继续列出来。如果你有其它推荐，也欢迎在评论中留言。

ncdu

ncdu 作为普通 du 的替代品，这在 Linux 社区中已经很流行了。ncdu 正是基于开发者们对 du 的性能不满意而被开发出来的。ncdu 是一个使用 C 语言和 ncurses 接口开发的简易快速的磁盘用量分析器，可以用来查看目录或文件在本地或远程系统上占用磁盘空间的情况。如果你有兴趣查看关于 ncdu 的详细介绍，可以浏览《如何在 Linux 上使用 ncdu 查看磁盘占用量》这一篇文章。

tin-summer

tin-summer 是使用 Rust 语言编写的自由开源工具，它可以用于查找占用磁盘空间的文件，它也是 du 命令的另一个替代品。由于使用了多线程，因此 tin-summer 在计算大目录的大小时会比 du 命令快得多。tin-summer 与 du 命令之间的区别是前者读取文件的大小，而后者则读取磁盘使用情况。

tin-summer 的开发者认为它可以替代 du，因为它具有以下优势：

在大目录的操作速度上比 du 更快；
在显示结果上默认采用易读格式；
可以使用正则表达式排除文件或目录；
可以对输出进行排序和着色处理；
可扩展，等等。

安装 tin-summer

要安装 tin-summer，只需要在终端中执行以下命令：

1	$ curl -LSfs https://japaric.github.io/trust/install.sh \| sh -s -- --git vmchale/tin-summer

你也可以使用 cargo 软件包管理器安装 tin-summer，但你需要在系统上先安装 Rust。在 Rust 已经安装好的情况下，执行以下命令：

1	$ cargo install tin-summer

如果上面提到的这两种方法都不能成功安装 tin-summer，还可以从它的软件发布页下载最新版本的二进制文件编译，进行手动安装。

用法

（LCTT 译注：tin-summer 的命令名为 sn）

如果需要查看当前工作目录的文件大小，可以执行以下命令：

$ sn f
749 MB   ./.rustup/toolchains
749 MB   ./.rustup
147 MB   ./.cargo/bin
147 MB   ./.cargo
900 MB   .

不需要进行额外声明，它也是默认以易读的格式向用户展示数据。在使用 du 命令的时候，则必须加上额外的 -h 参数才能得到同样的效果。

只需要按以下的形式执行命令，就可以查看某个特定目录的文件大小。

1	$ sn f <path-to-the-directory>

还可以对输出结果进行排序，例如下面的命令可以输出指定目录中最大的 5 个文件或目录：

$ sn sort /home/sk/ -n5
749 MB /home/sk/.rustup
749 MB /home/sk/.rustup/toolchains
147 MB /home/sk/.cargo
147 MB /home/sk/.cargo/bin
2.6 MB /home/sk/mcelog
900 MB /home/sk/

顺便一提，上面结果中的最后一行是指定目录 /home/sk 的总大小。所以不要惊讶为什么输入的是 5 而实际输出了 6 行结果。

在当前目录下查找带有构建工程的目录，可以使用以下命令：

$ sn ar

tin-summer 同样支持查找指定大小的带有构建工程的目录。例如执行以下命令可以查找到大小在 100 MB 以上的带有构建工程的目录：

1	$ sn ar -t100M

如上文所说，tin-summer 在操作大目录的时候速度比较快，因此在操作小目录的时候，速度会相对比较慢一些。不过它的开发者已经表示，将会在以后的版本中优化这个缺陷。

要获取相关的帮助，可以执行以下命令：

1	$ sn --help

如果想要更详尽的介绍，可以查看这个项目的 GitHub 页面。

dust

dust （含义是 du + rust = dust）使用 Rust 编写，是一个免费、开源的更直观的 du 工具。它可以在不需要 head 或sort 命令的情况下即时显示目录占用的磁盘空间。与 tin-summer 一样，它会默认情况以易读的格式显示每个目录的大小。

安装 dust

由于 dust 也是使用 Rust 编写，因此它也可以通过 cargo 软件包管理器进行安装：

1	$ cargo install du-dust

也可以从它的软件发布页下载最新版本的二进制文件，并按照以下步骤安装。在写这篇文章的时候，最新的版本是 0.3.1。

1	$ wget https://github.com/bootandy/dust/releases/download/v0.3.1/dust-v0.3.1-x86_64-unknown-linux-gnu.tar.gz

抽取文件：

1	$ tar -xvf dust-v0.3.1-x86_64-unknown-linux-gnu.tar.gz

最后将可执行文件复制到你的 $PATH（例如 /usr/local/bin）下：

1	$ sudo mv dust /usr/local/bin/

用法

需要查看当前目录及所有子目录下的文件大小，可以执行以下命令：

$ dust

输出示例：

带上 -p 参数可以按照从当前目录起始的完整目录显示。

$ dust -p

dust 2

如果需要查看多个目录的大小，只需要同时列出这些目录，并用空格分隔开即可：

1	$ dust <dir1> <dir2>

下面再多举几个例子，例如：

显示文件的长度:

$ dust -s

只显示 10 个目录：

1	$ dust -n 10

1	$ dust -d 3

查看帮助：

$ dust -h

如果想要更详尽的介绍，可以查看这个项目的 GitHub 页面。

diskus

diskus 也是使用 Rust 编写的一个小型、快速的开源工具，它可以用于替代 du -sh 命令。diskus 将会计算当前目录下所有文件的总大小，它的效果相当于 du -sh 或 du -sh --bytes，但其开发者表示 diskus 的运行速度是 du -sh 的 9 倍。

安装 diskus

diskus 已经存放于 Arch Linux 社区用户软件仓库Arch Linux User-community Repository（AUR）当中，可以通过任何一种 AUR 帮助工具（例如 yay）把它安装在基于 Arch 的系统上：

1	$ yay -S diskus

对于 Ubuntu 及其衍生发行版，可以在 diskus 的软件发布页上下载最新版的软件包并安装：

1
2
3

$ wget "https://github.com/sharkdp/diskus/releases/download/v0.3.1/diskus_0.3.1_amd64.deb"

$ sudo dpkg -i diskus_0.3.1_amd64.deb

还可以使用 cargo 软件包管理器安装 diskus，但必须在系统上先安装 Rust 1.29+。

安装好 Rust 之后，就可以使用以下命令安装 diskus：

1	$ cargo install diskus

用法

在通常情况下，如果需要查看某个目录的大小，我会使用形如 du -sh 的命令。

1	$ du -sh dir

这里的 -s 参数表示显示总大小。

如果使用 diskus，直接就可以显示当前目录的总大小。

$ diskus

我使用 diskus 查看 Arch Linux 系统上各个目录的总大小，这个工具的速度确实比 du -sh 快得多。但是它目前只能显示当前目录的大小。

要获取相关的帮助，可以执行以下命令：

1	$ diskus -h

如果想要更详尽的介绍，可以查看这个项目的 GitHub 页面。

duu

duu 是 Directory Usage Utility 的缩写。它是使用 Python 编写的查看指定目录大小的工具。它具有跨平台的特性，因此在 Windows、Mac OS 和 Linux 系统上都能够使用。

安装 duu

安装这个工具之前需要先安装 Python 3。不过目前很多 Linux 发行版的默认软件仓库中都带有 Python 3，所以这个依赖并不难解决。

Python 3 安装完成后，从 duu 的软件发布页下载其最新版本。

1	$ wget https://github.com/jftuga/duu/releases/download/2.20/duu.py

用法

要查看当前目录的大小，只需要执行以下命令：

1	$ python3 duu.py

输出示例：

从上图可以看出，duu 会显示当前目录下文件的数量情况，按照 Byte、KB、MB 单位显示这些文件的总大小，以及每个文件的大小。

如果需要查看某个目录的大小，只需要声明目录的绝对路径即可：

1	$ python3 duu.py /home/sk/Downloads/

如果想要更详尽的介绍，可以查看这个项目的 GitHub 页面。

以上就是 du 命令的五种替代方案，希望这篇文章能够帮助到你。就我自己而言，我并不会在这五种工具之间交替使用，我更喜欢使用 ncdu。欢迎在下面的评论区发表你对这些工具的评论。

via: https://www.ostechnix.com/some-good-alternatives-to-du-command/