充实的2月份

2月份发生了各种事,从线下蔓延到了线上,一定程度让自己有一些关注新闻欲过高。月初看了看冬奥会盛况,感叹也许只有中国人办的奥运才会能这么美。月中关注国内一些“历史遗留”问题,也算是非常有中国特色了。最后月底就是大国之间的博弈,在哪个社交app几乎都能看到关于这件事的新闻
然而回头一看,自己忘记的事情也有很多,不仅仅是思考这些事背后到底代表着什么,还有记录点自己内心的想法。也许是时候,带着轻松点的态度,给自己写点总结了~

开发相关的东西

首先就是继续把自己的 DockerFile 仓库更完善了下,虽然过程还是有些痛苦的,Centos7 在 Arm 上不能运行 dbus 服务,Centos8 官方 yum 源又不再支持,另外还有python 在两种架构下表现不太一致的问题。各种适配之后,终于把 开发镜像 做到了 x86 和 arm 架构都能够兼容了。总算是松了口气

除了开发镜像,还整理了最近了解的大数据相关服务:Jupyter,把它们的安装过程也整理到了 DockerFile 中。这两个组件都是数据开发过程必备的 IDE,或许有了这第一步,终于能够开始好好学习下 机器学习了?

Jupyter 效果:

jupyter lab

mysql connector demo

DockerFile 仓库

新的想法

除了日常做“正事”,也没忘记偶尔“胡思乱想”

树莓派

这个从买来就一直在吃灰的东西,在一次和同事的闲聊中,又有了搞起来的想法
也许确实没有很多时间去研究适合它的配件,不过至少在家一直开机,当一个服务器还是可以的吧?对于没有买云主机来说,有一个能长期运行的主机可太关键了,毕竟要台式机一直开着还是有点麻烦
但是在此之前,还需要稍微做一些准备工作,默认树莓派刚买到是需要先用 SD 卡刷好操作系统的,但是这显然不适合做需要更高写的服务了,甚至还有很高的把 SD 卡写坏的风险。需要换成 SSD
这里先记录一下之前搜的教程,等搞好之后“也许”自己会再发个踩坑记录吧,就是几时能写好就不一定了

树莓派4 SSD 启动

新闻过滤算法

在国内外都在打各种信息战的时候,怎么才能过滤出对自己最有用的新闻呢?
毕竟人一天的精力终归有限,怎么样更高效的过滤自己想看的新闻,显然是可以借助一些算法实现的
但是现实情况往往很复杂,对每个人,每个时间段的需求可能也不一样,有人就更喜欢那种深入剖析,比较长篇的新闻,但是也可能会有想休息,想吸收点快餐类新闻放松的时候。这就意味着这个算法模型可能会有多种,而且还会因人而异
如何才能训练出这种更高效的算法,又是一个需要长时间检验的过程,哎,想了想,技术确实能改变人的生活,但是想和现实完美结合,还是很难啊。不知道猴年马月自己才能先做出一个适合自己的模型。。