2023 年

吴诗涛 2023-02-19


第 07 周(0212-0218)

本周一(0213)正式入职,开始数据分析实习。周一周二主要看公司文档,参加新人入职培训,熟悉公司的产品、运行模式。周三的数据核对工作,利用 R 语言很快解决了,周四周五配合策略分析师计算指标数据。在数据库操作上,发现自己的 MySQL 还不能满足工作需求,需尽快补上索引、窗口函数和复杂 SQL 优化方面的技能。

初入职场,在熟悉业务中探索职业发展方向。数据分析是一项技能,单纯用于职业发展显得单薄。目前想到两条发展路径:

  1. 数据分析师 -> 策略分析师 -> 产品方向。可以结合经济学专业,发展路径比较成熟。
  2. 数据科学家。技术精进是自己的追求,也是目前公司新业务线的需求,但难度大。

开始调整生活作息,努力增加骑行通勤次数,强身健体,工作生活和身体都顾上。

下周:

  1. 熟悉业务,继续学习 MySQL;
  2. 了解策略分析师的指标构建过程;
  3. 毕业论文(拖不下去了)。

第 08 周(0219-0225)

本周忙,我师傅说这周工作强度大于平常,这个强度对我来说还可以。这周主要配合策略分析师计算指标、确定阈值,还参与了几个指标的讨论和完善。工作很开心,同事间关系简单,部门同事很关照我这位实习生,我师傅会在忙中抽空问我感觉怎么样。最开心的是周五下班前策略跟我说「以后转策略分析师吧」(已于四月转岗)

随着工作不断上手,逐渐了解公司数据库的性能情况,周四(0223)晚下班前执行了几个查询,想在第二天早上来看结果,不料影响到了生产数据库,运维跑来让我注意 SQL 性能。

工作日下班回来小王会在校门口等我,不加班的时候我们一起吃晚饭,加班的时候我们一起散个步然后回寝室洗洗睡大觉。这周利用五点多早起的时间看完了《白话机器学习的数学》,补机器学习的基础知识。

下周:

  1. 尝试利用「MySQL 执行计划」优化 SQL 查询,如有必要,补充「存储」方面的知识;
  2. 毕业论文。

第 09 周(0226-0304)

本周工作不忙,周五(0303)公司团建,和部门的小伙伴们一起爬山、吃吃喝喝、围炉煮茶。工作的四天活不多,大部分时间在学习公司内部分享的 MySQL 资料,目前学到关于索引、表锁等基础内容。本周接触到产品测试方面的一些内容,之前未曾了解过。

趁爬完山后的放松,周六(0304)在家琢磨了用 R 读取 JSON 列,日后很需要。

本周通勤全部打车,购买打车优惠券之后每次打车在 20-23 左右。白天上班路上看会儿书,Kindle 随身带;晚上返校路上闭目养神,「回魂」一下。

下周:

  1. 毕业论文;
  2. MySQL 资料;
  3. 轮流刷《Google 软件测试之道》和《从零开始:机器学习的数学原理和算法实践》;
  4. 为开启 C++ 学习做好心理准备。

第 10 周(0305-0311)

这周跑数据算指标,指标设计得很复杂,高强度使用 R 让我对 tidyverse 的掌握提升了不少,通过思考就可以排除一些不可行的解决方案,然后去尝试几种「大致可行」的方法,最终写出解决问题的代码,效率高很多。

这周最印象深刻的是:分组后用窗口函数的操作,底层用 tibble 跑了五十多分钟,而仅把底层改成 data.table 十三秒就搞定。借助 dtplyr 可以延续 tidyverse 语法写代码的简洁,又享受 data.table 带来的高效,是未来工作中处理较大数据量的好方案。

另外发现:在日期计算中涉及到月份计算需格外小心,因为月末天数不一致,很容易产生意料之外的问题(比如说 3 月 31 日往前推 1 个月,如果写 ymd("2023-03-31") - months(1) 则会返回 NA,因为 2 月没有 31 日,正确的写法是 ymd("2023-03-31") %m-% months(1)),需熟练掌握 lubridate 的功能,速查表写得很详细。

本周生活无恙。

下周:

  1. 毕业论文(俺的论文有点胡适打牌的样子了);
  2. MySQL 资料;
  3. 《从零开始:机器学习的数学原理和算法实践》;
  4. 《C++ Primer Plus》慢慢看。

第 11 周(0312-0318)

这周赶上毕业论文中期检查,周一(0313)到周五(0317)前都搞得很紧张,这种被 Push 的滋味不好受。紧张又忙碌的一周,收获也很丰富:

  1. 使用 lubridate%--% 进行日期差计算时需注意日期正负;
  2. case_when() 时需注意判断逻辑的先后顺序;
  3. 终于可以熟练使用 map() 系列函数了;
  4. 学会使用 reticulate 包在 R 中调用 Python 脚本中定义的函数,目前对数据类型的转换还不是很熟悉,等熟练之后写一篇博客;
  5. 在睡前和打车路上看完了《从零开始:机器学习的数学原理和算法实践》笔记仍在整理中 笔记已在 0321 整理完毕)。

这周六(0318)参与乐高活动,周五(0317)因为工作无法抽身去组织,这也让我有机会看到了小伙伴们的成长,毕业前慢慢将大部分工作交手出去。

下周:

  1. 图谱分析学习;
  2. 瞄几眼《C++ Primer Plus》;
  3. 闲来无事时看会儿《戴建业精读老子》;
  4. 哦该死的毕业论文。

第 12 周(0319-0325)

这周粗浅地学到了如何结合业务去分析无监督学习的结果,随着对业务的理解不断深入,慢慢把无监督学习纳入自己的工具框中。

实习已经一个多月了,在做的项目即将进入下一个阶段,回头看之前写过的代码,还有很多要改进的地方,记录一些粗浅的想法,或许日后可以独立成篇:

  1. 代码的逻辑应跟着数据处理的逻辑,而不是函数书写的逻辑。这点感悟来自一个指标计算时犯下的错误:

    dplyr 1.1.0 引入 .by 参数,它提供了简洁性,避免为简单的分组操作写下 {data} %>% group_by() %>% foo_bar() %>% ungroup() 一长串代码(ungroup() 是经常容易忘记的操作),而是直接 foo_bar(..., .by = group) 即可。然而前者也有优点,那就是思维上的连贯,更让管道操作符 %>% 具有「然后」的意味,.by 将「分组,然后计算」合二为一,变成「计算,以 group 分组」,在思维上有一个逆向的过程。在我尝试将这个更新纳入我的代码风格时,由于习惯了写前者,我会忘记写 .by 参数,导致没有进行分组计算而造成错误。

    为此,我计划以后在使用到类似的计算时,先写 .by 参数,变成 foo_bar(.by = group, ...),这样可以延续前者思维上的连贯。

  2. 如何组织数据分析的文件项目,将文件组织有序,让别人和日后的自己也可以轻松地看明白现在写下的代码,这和「写代码」一样重要。目前尝试尽量在 Quarto 中进行数据分析,及时记录分析过程和结论,既方便组织,也方便分享。

下周:

  1. 用 Quarto 写一下毕业论文的实证部分;
  2. 《C++ Primer Plus》;
  3. 《戴建业精读老子》。

第 13 周(0326-0401)

这周请了周四周五(0330-0331)两天假,合着周末两天,把论文写完了,因为 DDL 是第一生产力。四月开始转岗为策略分析师,开始学新东西啦!不过要注意继续精进 R 语言。

下周:

  1. The tidyverse style guide
  2. 《高性能 MySQL》(第 4 版);
  3. 《财务诡计》。

第 14 周(0402-0408)

这周在补财务方面的基础知识,包括财税票三部分,大一大二学的会计方面的课程还是有用处的。周三(0405)清明节一天假期,在寝室写了 实习感悟,感触很多。

下周要交毕业论文初稿,收到了同学的求助,帮他们处理论文中的实证部分。大三《计量经济学》课程中关于面板数据回归的部分已忘得差不多了,加之自己的毕业论文用的是截面数据,正好遇上其他同学需要,这周粗糙地补了补。周六(0408)和小王一起回家的时候重新翻了翻《为什么》,然后把两本 Angrist 的计量经济学教材都带回来了,有兴趣地时候翻吧。

周六(0408)公司搬家啦!现在在蒋村地铁站附近,离学校更近了。新工位反而有点小,置办了显示器增高架,明天(0410)去安上。

下周:

  1. The tidyverse style guide
  2. 《财务诡计》;
  3. 《图数据库》。

第 15 周(0409-0415)

上周六(0408)公司搬家出力多,周一晚(0410)被叫去聚餐啦哈哈!

这周二(0411)参与模型实施小组讨论,感受到了产品经理与模型研发人员视角的差异。简单来说,我们注重模型的准确性,产品经理还注重模型的快速响应和迭代。此外还看到数据开发人员对于数据存储的谨慎和长远规划。

周二晚(0411)还去听了关于 ElaticSearch 的技术分享,虽是管中窥豹,但对操作大数据的理解更近一步。

这周的工作除了熟悉财税票,还在重构前两个月来写过的 R 代码。回看之前写过的代码时常让我眉头紧蹙啊,看来之前的代码并不清晰明了,也缺乏关于「为何写这条代码」的注释。这次重构的时候除了注重代码的效率,也把代码的清晰明了摆在最前面。

毕业论文这一吃时间的「大老虎」在这周卷土重来,几乎除了上班就是在改毕业论文啦,还好第一次查重就满足了学院对毕业论文的重复率要求。

下周:

  1. 《图数据库》;
  2. Python and R for the Modern Data Scientist

第 16 周(0416-0422)

这周做了些数据测试的工作,当然不是做测试工程师哈哈。数据测试是个细活,一点点摸门道。为了方便测试,找 DBA 开通了数据库直连的权限。用 R 直连公司数据库,相比前两个月做 SQL Boy 自然是酷炫了很多。

上周重构了一次代码后,现在写代码就会想着要做抽象、要简洁、要可复用……不过 tidyverse 做了 data masking 和 tidy select,这对于使用 tidyverse 中的函数构造自己想要的函数有一定的难度。目前还没有掌握,争取早日突破!

下周三(0426)毕业答辩,特地把毕业论文实证部分的代码都整理到了一起,但是偷懒没有做重构哈哈。

下周:

  1. 学习 data masking 和 tidy select;
  2. Mastering Shiny
  3. Python and R for the Modern Data Scientist

第 17 周(0423-0429)

这周工作主要是做数据测试,字段开发的质量令人捉急。测试之余在写 Shiny 用于搭建模型工厂,之前的 Shiny 码力告急,边写边看 Mastering Shiny 回血。目前需攻克 Shiny 的模块化,用于减少重复。写 Shiny 的时候整了一个挺满意的函数,工作中经常会用到,下周添加到俺的 stfun 里边。

周二(0425)在 yihui提醒下把博客的评论系统改成了 Giscus,支持楼中楼,写博客的动力更强了。另外,yihui 提醒俺可以把公众号的正文也搬过来,俺动力十足。这周学习了一下 Pandoc。

周三(0426)毕业论文答辩终于结束了,可以放飞自我学习玩耍了。

下周:

  1. Mastering Shiny
  2. 《图数据库》。

第 18 周(0430-0506)

五一假期家里蹲,整理下本地的读书笔记放到了博客上,过程中学到了使用 system() 去调用 Pandoc。也在叶寻煽风点火下注册了域名(shitao5.org),要多写多更新。

这个假期是实习后第一个小长假,在家把工作中会用到的一些小函数收拾到了 stfun 中。在用 Shiny 的时候感受到化繁为简不仅可以带来美观的代码,还有写代码时更小的心智负担。

工作上,这周还是在做数据测试。对于死活对不上的字段,直接要来了开发的 Python 代码检查检查。俺的 Python 功力几乎为零,在运气的加持下检查出了一些问题。看别人的代码有一个意想不到的好处:如果对方功力深厚,可以学到很多代码技巧。

下周:

  1. Mastering Shiny
  2. 《图数据库》。

第 19 周(0507-0514)

这周调整周总结日期,改为每周一至周日的总结,更符合俺的生活周期。

上周日(0507)和小王在图书馆一起学习,晚上陪她去做了美甲。第一次去美甲店,原来做美甲这么热闹,采用现场取号的模式,大有「美甲经济」的样子。

周一(0508)公司新来一位算法工程师,期待他大展神威,让俺瞧瞧传说中的「算法攻城狮」。周三(0510)开始一脚踏入 Python 的地盘,用开发的 Python 跑 R 环境中的数据,以测试开发的 Python 脚本,感觉不错。周四(0511)看起了 dplyr 的源码,被大佬们的代码所惊艳,赶紧拿起小本本做笔记

周六(0513)上午身体躲在寝室里,灵魂冲浪在油管上,看了几个图论方面的视频,让俺入门一下拜托啦!下午参加了 REACH 奖学金颁奖典礼,至此,俺的大学画上圆满句号。颁奖典礼结束后和兴哥聊了到深夜,其中自然不乏俺最爱的请客吃饭环节哈哈!这周正赶上校园开放 + 校庆,学校热闹非凡,是三年来不曾见过的景象,很是欣慰。

周日(0514)上午继续窝在寝室,冲浪了一波气功心法,这玩意儿看起来玄乎,俺要琢磨一阵时间的真假。下午耕博客,早上给麻麻送去母亲节祝福时被告知俺的博客翻页太麻烦,赶紧把归档页面放在侧栏中,这样俺的博客就不是「妈见打」系列啦!

下周:

  1. An Introduction to APIs
  2. 《图数据库》;
  3. 运动。

第 20 周(0515-0521)

这周看完了《图数据库》,在寻找后续学习资料时看到了《网络、群体与市场》,其中最让我吃惊的是图居然和博弈论密切相关。绕了一大圈,又回到经济学专业的内容来了,一点点探索。

图数据库 Neo4j 是用 Java 写的,提供了 Java API 用于交互。公司后端用的也是 Java,还有以后要用到 Spark 之类的大数据框架都离不开 Java。这些让俺对之前学 C++ 的选择有些动摇。俺无意参与语言之争,但是精力有限,慢慢地还是要选择一门进行钻研。

这周工作主要是模型系数估计,大部分是计量经济学里边回归的内容。工作后觉得,对以前学习内容的底层原理掌握不够,导致对计算后的结果没有信心,需要去补一些基础的知识点。另外,慢慢养成写文档的习惯,方便将思路捋顺,也让大家知道俺在做什么。

下周:

  1. Python and R for the Modren Data Scientist

第 21 周(0522-0528)

这周工作上跟着一个产品,估计下月就能上线。工作慢慢趋向平淡,在平淡中找到乐趣,跟着乐趣走。

或许这是最后一个在学校寝室里写的周总结。六月中旬毕业典礼,不想赖到学校「秋风扫落叶」般赶人。这周末找好了房子,下周末搬家。新家在学校不远处,有需要便可常回学校看看。

周五(0526)晚和小王一起到一位导师家吃饭,大学四年认识了几位待我们很好的导师,万分幸运,倍感珍惜。

下周:

  1. 恢复晨跑,坚持,加油!
  2. Python and R for the Modren Data Scientist

第 22 周(0529-0604)

早起运动情况:跑步 20.68 公里,跳绳 5401 个。

这周看完了 PyR4MDS,了解到 Python 在机器学习、文本分析、图像处理等领域比 R 方便快捷的地方。准备在 Python 上花功夫,尽快成为一位双语玩家。

这周工作照常,但遇到了人事变动,第一次感受到职场的残酷。

下周:

  1. 鸢尾花书/3-数学要素

第 23 周(0605-0611)

早起运动情况:跳绳 8719 个。

这周交接了工作,里边有很多学问,交接的时候要敢于提问,敢于要资料。 对于「交」的人来说很简单的内容,如果不说明清楚,「接」的人可能要采很多坑。 这是这次和算法大佬一起交接的时候学习到的。

本周工作照常,交接之后活更多一些,也督促自己提升效率。 目前首先打算是再次提升一下 SQL 功力。 周五(0609)临时接到任务,整个部门加班到了 23:00,这也使我最后一次在学校寝室睡觉的日子停留在了 2023 年 6 月 8 日(周四)。

周末和小王一起搬家,我们都低估了搬家任务量,好在兴哥「执意」帮我们搬家,分担了我们不少「皮肉之苦」。 感谢兴哥,感谢俺和小王的室友们,感谢货拉拉。

下周:

  1. 鸢尾花书/3-数学要素

第 24 周(0612-0618)

运动情况:跑步 21.7 公里。

周三周四(0614-0615)毕业典礼请假,作为毕业生代表发言。工作照常。

在工作中遇到越来越多样的数据处理场景,对于抽象具体工作到函数(甚至是包)的紧迫感越来越强。 周末学习再次学习了元编程,尝试去掌握:代码即数据(code is data)、代码即树(code is a tree)和代码生成代码(code can generate code)的理念。

为记录更加细节的学习笔记,创建了 Quarto Website 挂在子域名(learn.shitao5.org)下。 将学习的过程记录在学习笔记中,写作输出放到博客,这样做的考虑是:

  1. 日常的学习笔记是在 Quarto 中写的;
  2. Quarto 对于 Python 的支持;
  3. Quarto 在排版时的便捷。

最近发现域名偶尔(频率还挺高)会有无法访问的情况,尝试添加了几个 DNS,等分发完测试一下。

下周:

  1. Advance R

第 25 周(0619-0625)

因为端午调休忘记写总结,这周二(0627)早上赶紧补上。

运动情况:跑步 15.53 公里,骑行 14.03 公里。

工作照常。周三(0621)签了劳动合同,正式开启打工人的生活。 有时我觉得很梦幻,兴趣和工作都是打代码,与数据打交道; 有时我觉得很遥远,成为数据科学家,我要学的还很多。

端午(0622)骑了 14 公里小单车去姐姐公司,然后一起回了家。 和往年一样,今年家里的李子大丰收。 自己租房有冰箱后,俺也可以享受从家里「进货」的感觉啦! 周六(0624)返程的时候带了家里的生菜、黄瓜、李子、鸡蛋…… 等到工作和生活更稳定些,尝试多做做菜。

下周:

  1. 《数据科学实战》
  2. 《动手学深度学习》

第 26 周(0626-0702)

运动:跳绳 2002 个,骑行 27 公里。

工作照常,开始承接从取数到指标计算、结果输出这一环。

周六(0701)公司团建,带上小王去了富阳新沙岛,玩了皮划艇、越野车等项目,挺过瘾。周日(0702)晚和兴哥一起淋雨骑车上龙井,下来的时候他不小心摔了一跤,消毒处理完,祝尽早恢复。

下周:

  1. 《动手学深度学习》
  2. Practial Statistics for Data Scientists

第 27 周(0703-0709)

运动:跳绳 1202 个,骑行 42 公里。

工作照常,下周公司年会,花一些时间排练节目。

周六(0708)静下心来思考毕业以来的状态,感觉没有以前静心了, 接下来会去平复。晚上和兴哥环西湖骑行 42 公里,半夜才回家。

周日(0709)中午和兴哥去学校对面吃了黄焖鸡,吃完竟下起了雨。 冲到学校里边躲雨,正巧彭老师在学校,聊了两个多小时。 晚上和小王还有高中同学一起吃了饭,距上一次一起吃饭已经两年多, 现在大家都进入工作状态,聚的机会就会多些。

下周:

  1. 《高性能 MySQL》(第四版)
  2. Python Data Science Handbook

第 28 周(0710-0716)

运动:跑步 10 公里,骑行 148 分钟。

周日晚(0716)年会结束,节目表演还过得去。

这周尝试在工作中用暴力搜索解决一些问题,遇到了代码执行效率低、不会并行计算等瓶颈,慢慢研究。 之前写的 stfun::send_message_wx() 可以及时把运行情况和结果发送到企业微信, 让我不用守在工作电脑前等程序运行,有了很大的灵活性。

下周:

  1. 熟悉 tidymodels

第 29 周(0717-0723)

运动:跳绳 536 个,骑行 126 分钟。

这周尝试给暴力搜索调优,过程中发现自己对线性代数的了解还不够。

周五(0721)和俺差不多一起入职的实习生主动离职,去旅游一阵。 果然,未来的希望在 00 后呀!

周六(0722)回学校参加了一个采访,和准大二的同学聊聊天。 回想起自己大一暑假,和朋友去千岛湖临岐镇拍了宣传片,去上海参观了国信证券, 还带队参加了经济管理案例分析大赛。 那是唯一一个没有疫情、没有封控的暑假,好在它充满意义,让我欣慰。

周日(0723)和小王去西溪印象城吃饭购物啦!迪卡侬便宜实惠,我的快乐老家! 从西溪湿地骑车回家,舒舒服服。

下周:

  1. Feature Engineering and Selection: A Practical Approach for Predictive Models

第 30 周(0724-0730)

运动:跑步 16.89 公里,骑行 3.8 小时

工作照常。 感觉自己的代码水平有所提高。 现在写代码前会看一遍项目,先抽象出一批常用函数。 而后在干活的过程中继续抽象,不断简化代码。 对于一些实用的功能,收入自己的 R 包中。

一直期待去掌握一门底层的编程语言,C++ 看了几眼就搁置了。 这周偶然刷到了 Rust 的学习资料,Rust 给我的感觉更加亲切, 希望它和它优秀的学习资料让俺能入个门, 而不是入门 -> 入门 -> 入门 -> 三过家门而不入。 通过 extendr 可以让 R 与 Rust 联动, 不会让 Rust 与我现有的技能割裂开来。

周末折腾了 Python 环境,最后发现:Anaconda 真鸡肋! 直接 PyCharm 就可以搞定环境配置。 虽然一直尝试配置一个大一统的 IDE,可以让俺在一个地方写所有代码, 但是一番努力后发现希望不大,即使可行,也是各门语言互相迁就。

现在放弃了大一统的尝试,R 无疑是 RStudio,Python 是 PyCharm,Rust 是 VSCode。 最终将内容输出(.qmd.ipynb)统一到 Quarto Website 上。

周六(0729)过了生日

下周:

  1. Feature Engineering and Selection: A Practical Approach for Predictive Models
  2. 《Rust 语言圣经》

第 31 周(0731-0806)

运动:跑步 6.38 公里,骑行 3.8 小时。

工作照常。 这周承接了一些数据测试工作。使用 R 去实现一些数据操作的效率真得很高。

周末回家,家里大丰收

下周:

  1. Feature Engineering and Selection: A Practical Approach for Predictive Models
  2. feature engineering
  3. 《Rust 语言圣经》

第 32 周(0807-0813)

运动:跑步 6.39 公里,跳绳 1608 个,骑行 3.9 小时。

工作照常。

周六(0812)和小王去上海大剧院看了音乐剧《人间失格》,舞台效果挺震撼,演员们都很出色。 搞来了无损的专辑,耳放和森海塞尔不用落灰了。

下周:

  1. 尝试将部分数据处理迁移到 data.table 上;
  2. 《计算机科学导论》
  3. 《Rust 语言圣经》

第 33 周(0814-0820)

运动:跑步 13 公里,骑行 3.7 小时。

这周在 TP 数据库(MySQL 和 PostgreSQL)查询上遇到性能问题,好在数仓的小伙伴在 ES (Elasticsearch) 中做了表同步。 在 AP 数据库上任由我折腾,遇到了 ES 输出结果最多一万行的限制。 测试小伙伴知道我不太熟悉 Python,说我之前帮他做了测试,这次他抽空半小时给俺写了个 Python 脚本抓所有 ES 查询结果,省去了我不少折腾功夫。

这周和小王打赌十点半前睡觉,赢得了一双碳板跑鞋(鸿星尔克·芷境),目前跑了两个五公里,配速在 4′30。 感觉还不错,多磨合,多运动。

下周:

  1. 《计算机科学导论》
  2. 抽空尝试用 R 写一个抓 ES 所有查询结果的方法。

第 34 周(0821-0827)

运动:跑步 17.75 公里,骑行 4.8 小时。

周三(0823)参加了迪卡侬的荧光夜跑活动,全程十一公里左右,用时一小时零一分钟,跟着大部队跑了一半后才单飞,有点晚,没能进一小时。

周六(0826)提车,自己的第一辆公路车,努力成为一个骑手(有个铁锭)。

下周:

  1. 《计算机科学导论》
  2. Applied Machine Learning Using mlr3 in R

第 35 周(0828-0903)

运动:骑行 149.16 公里。

周五(0901)下班骑车投奔姐姐,拆掉公路车的前轮放进后备箱就把车车载回了家。周六(0902)晚骑车去乌镇西栅景区门口打卡,来回 70 公里左右,用时 3 小时。回家路上遇到两位顺路的骑友,一路同行。

下周:

  1. 《数据挖掘:概念与技术》
  2. Applied Machine Learning Using mlr3 in R

第 36 周(0904-0910)

运动:骑行 116.37 公里,跑步 6.33 公里。

本周骑 I my bike 上下班,骑公路车兜风溜达。这周起床时间更早一些,五点左右醒一次,状态好的话运动,差一点的话学习,再差一点就继续睡。

本周工作上大数据的分析开始往 data.table 转,也在 data.table 和 tidyverse 之间找一个度。每天提前四五十分钟到公司,看几页《精通计量》。

周末在家搞卫生、蒸包子、煎牛排,和小王寻找了她上班的最优路线。最近身体状态和生活节奏都还不错,正好把机器学习方面的体系搭建起来。

下周:

  1. 《数据挖掘:概念与技术》
  2. 《mlr3verse 技术手册》

第 37 周(0911-0917)

运动:骑行 107.58 公里,跑步 10.15 公里。

骑行方面,周五(0915)晚环西湖 40 公里的骑行,发现自己在连续骑行两小时左右会有小阵的眩晕,估计是没吃太多晚饭以及没有及时补充糖分导致的低血糖。因为自己运动不会很渴,也没有多喝电解质水,下次应注意骑行过程中多喝水,两小时左右补能量胶。

跑步方面,周六(0916)晚小跑十公里,配速在 4′36,感觉还有提升的空间,可以循序渐进,冲击 4′20 配速。

这周开始学习算法,看的书是《Hello 算法》。一是对算法感兴趣,二是借机学习下 Python,三是觉得这本书写得好,欣赏并学习源码。

下周:

  1. 《Hello 算法》
  2. 《精通计量:从原因到结果的探寻之旅》
  3. 《被讨厌的勇气》

第 38 周(0918-0924)

运动:骑行 116.51 公里。

工作上,本周根据客户反馈对产品进行数据质量排查,写数据质量报告。目前离线的数据主要存放在 Elasticsearch 和 Neo4j 中,非关系型的数据库之前用的不多,还要多多熟悉。尤其是 Elasticsearch,用法比较灵活,多看看官方文档

下周:

  1. Elasticsearch Guide 8.10
  2. Applied Machine Learning Using mlr3 in R
  3. 《Hello 算法》
  4. 《精通计量:从原因到结果的探寻之旅》
  5. 《被讨厌的勇气》

第 39 周(0925-1001)

运动:骑行 101.36 公里。

工作上,数仓已经开始留存后续建模需要的数据,国庆上去有得忙一阵子。进入四季度,工作节奏会加快,仍需保持学习和健身。

周五(0929,中秋)从杭州骑行回家,全程 62 公里,用时 3 小时,其中半小时在等红绿灯。

国庆假期吃吃喝喝,作息也没有日常规律,身体无恙。或许是得益于近来的健身,放在读书时期,我早已要生病了(类似口腔溃疡)。周日(1001)白天在嫂子家吃烧烤,晚上和妈妈姐姐、小表姐和哥哥一起去崇福镇上买衣服,因为明天(1002)是小表姐订婚的日子,我们几个「杭漂」的衣服都在杭州,所以临时抱佛脚。

下周:

  1. Applied Machine Learning Using mlr3 in R
  2. 《Hello 算法》
  3. 《被讨厌的勇气》

第 40 周(1002-1008)

运动:骑行 134.55 公里,跑步 11.02 公里。

本周工作日和节假日反转,周一至周五(1002-1006)放假,周末(1007-1008)连着下周五天连续上七天班,所以今天(1008)虽然是周日,但也是星期负一。

周二(1003)带着粑粑去皮肤科医院把背上长的一颗小东西给手术切除了。给粑粑上的一课是:小毛病尽早治,拖成大毛病就要挨刀子咯!

周三(1004)早上骑行回杭,假期最后三天闭关调整,学 mlr3verse,基于 R6 和 data.table 的设计让它高效地处理机器学习的项目,还有一些糖函数,专门为我这样的记性差人士准备。

周末已经在公司上手 mlr3verse 了,希望自己上手的第一个机器学习项目顺利。

下周:

  1. Applied Machine Learning Using mlr3 in R
  2. 《Hello 算法》
  3. 《被讨厌的勇气》

第 41 周(1009-1015)

运动:骑行 150.55 公里。

本周工作忙得团团转,又是跑模型又是写数据报告。周四(1012)顶不住没有「申请加班」,骑行 50 公里,浑身舒爽。有时候困倦袭来,不是休息太少,或许是需要运动。

周六(1014)晚和小王相约钱塘江边绿道骑行,没曾想低估了晚上的温度,两人冻得鼻涕水直流。好不容易骑到钱塘江边,以为目标达成,一看百度地图,连绿道起点都没到。好在两人一致同意掉头跑路,回来吃了羊肉面和羊肉串嘿嘿。

周日(1015)玩 Docker 把电脑玩炸了(尝试把 D 盘的部分磁盘分配给 C 盘失败),索性全盘装了 Ubuntu 系统,再来折腾一番。

下周:

  1. Applied Machine Learning Using mlr3 in R
  2. 《被讨厌的勇气》

第 42 周(1016-1022)

运动:骑行 184.68 公里。

本周结束一个模型,开始进军下一个模型。一种模糊的感觉:建模除了技术和经验,也需要一些想象力。

周六(1021)装回了 Win11,这次只装了一个 C 盘,需要定期备份资料。而后来了一次青山湖骑行

周日(1022)下午和小王去杭师大北边的小乡村骑行一圈,拍了小红书上最近很火的「扛车照」。

下周:

  1. Applied Machine Learning Using mlr3 in R
  2. 《被讨厌的勇气》
  3. 《书剑恩仇录》

第 43 周(1023-1029)

运动:骑行 221.98 公里,跑步 6.36 公里。

本周的运动量可观,主要是周六(1028)往返一趟家,周日(1029)晚和小王一起跟捷安特车店的骑友去良渚博物馆荡了荡腿。

三个月前响应老板的号召,原以为已经过去,本周意料之外地收到了转岗的消息。周五(1027)交接手上的工作,搬好了工位,下周开始新工作。

下周:

  1. 《被讨厌的勇气》

第 44 周(1030-1105)

运动:骑行 52.33 公里。

转岗第一周,加班有点晚,或许后面是常态。本周运动和阅读量均有所下降,适应工作后要尽快跟上。

一周没怎么写代码就感觉有些手生,尤其是刚学完还没巩固的 mlr3verse。周末又往萧山跑了两天,喜提一个大大的口腔溃疡。

工作上上手还算快,继续加油!

下周:

  1. 《被讨厌的勇气》

第 45 周(1106-1112)

运动:骑行 63.78 公里。

本周降温,杭州一夜入冬,运动量陡降。

周六(1111)家里蹲看完了《被讨厌的勇气》。晚上兴哥来家里,聊了聊天,他分享了求职面试中的见解与感悟。

周日(1112)在家写职业生涯规划的分享幻灯片,导师希望我和学院的学弟学妹们分享一些经验。好嘛,我也是职场小白,那就鼓励大家多发展兴趣,不要虚度了时光。

下周:

  1. 《中华人民共和国劳动法》

第 46 周(1113-1119)

运动:骑行 36.24 公里。

周四(1116)第一次陪同老板去见客户,想起一句话:老板是一个公司最大的销售。实至名归。

周末和小王回家啦!家里的阳光真舒服。姐姐买了个绑在地上的网球,在自家门口的场地上打得出汗。把俺退下来的 Mate 30 Pro 给麻麻用了。

下周:

  1. 《管理行为》

第 47 周(1120-1126)

运动:骑行 173.53 公里。

本周有老板带着去见客户、有参与和高校的产学研交流。更积极地参与到会议中去,思考各部门主管总监表达时的立场,快速去成长。

周六(1125)被搬回学校「救火」了,回学校总是会回想起大学的生活,现不能回也不想回到过去。

周日(1126)去西湖风景区溜达一圈,回来路上送一位走不动路的奶奶回了家,这件事有空写一篇博客。(1202 更新:骑行路上的老奶奶

下周:

  1. 《精益企业》

第 48 周(1127-1203)

运动:骑行 50.8 公里。

周一(1127)不大舒服,有些发烧,晚上去药店买了奥司他韦和抗病毒口服液一顿喝,愣是周二(1128)就好了。小心保养了一周,现在应该差不多了。

周日(1203)早上带了半指手套出去骑车,5℃,手指实在吃不消。冬天还是等早上除了太阳再去骑车。晚上和导师去下沙,给学弟学妹们做了职业生涯规划的小分享,希望对他们有帮助。

下周:

  1. 《精益企业》
  2. 《卓有成效的管理者》

第 49 周(1204-1210)

运动:骑行 93.64 公里。

工作:

  1. 在同事指导下给出差的老板订北京的包厢;
  2. 陪同老板见客户,再次感受「老板是最大的销售」;
  3. 以总助的身份接待来访人员;
  4. 起草了公司层面的文件,正在过审。

生活:周六(1209)一口气读完了《Python 神经网络编程》并在周日(1210)写了读后感

下周:

  1. 《卓有成效的管理者》;
  2. 《公司法学(修订本)》;
  3. 《苏世民:我的经验与教训》(Kindle)。

第 50 周(1211-1217)

运动:骑行 20 公里。

工作:

  1. 周五(1215)公司举办了数字服务大会,工作后第一次穿正装;
  2. 周一(1211)到周四(1214)在写稿子。

生活:周六(1216)大学同学从江苏来杭,俺请客吃饭,尽地主之谊。聊近况、谈规划,到深夜。

下周:

  1. 《公司法》
  2. 《公司法学(修订本)》;
  3. 学习 Web 开发
  4. 《卓有成效的管理者》;
  5. 《苏世民:我的经验与教训》(Kindle)。

第 51 周(1218-1224)

运动:骑行 32.12 公里,跑步 12 公里。

工作:

  1. 周三(1220)做了关于制度的线上培训,是一个没有感情的朗读机器;
  2. 周五(1222)整理了时长 3.5 小时的共创会的会议纪要。

生活:

  1. 周六(1223)和兴哥一起在零度的夜晚跑步 12 公里,好久没运动,居然还能 55 分钟拿下,看来已经稳稳地守住了四分配;
  2. 周六(1223)写好了 2024 年周总结中运动数据可视化的代码;
  3. 2023 年总结开始动笔;
  4. 2024 年研究生考试今天(1224)结束,祝身边的小伙伴都能如愿以偿。

下周:

  1. 《公司法学(修订本)》;
  2. 学习 Web 开发
  3. 《卓有成效的管理者》;
  4. 《苏世民:我的经验与教训》(Kindle)。

第 52 周(1225-1231)

运动:骑行 44.56 公里。

工作:

  1. 周一(1225)早上扮演圣诞老人给大伙儿发圣诞礼物;
  2. 周三(1227)中午元旦集福,发现自己描的毛笔字还不错;
  3. 周六(1230)下午临时去公司干了个小活;
  4. 本周是全年最后一周,商务冲业绩太疯狂了。

生活:

  1. 周六(1230)中午受邀参加一位导师的研究生毕业送行,也算师门聚餐;
  2. 托丹东的战友给自己家、小王家和一位导师家寄了草莓。

下周:

  1. 《公司法学(修订本)》;
  2. 《荣格自传》
  3. 学习 Web 开发
  4. 《苏世民:我的经验与教训》(Kindle)。