方砚花了一整个周末做课程项目。
项目的选题是他自己定的,数据挖掘方向,
用爬虫抓取某音乐平台的公开接口数据,做创作者行为模式分析。
这种选题在计算机系的课程作业里很常见,
数据量大,模型简单,出图漂亮,答辩的时候容易讲清楚。
他写好爬虫脚本之后跑了一晚上,第二天早上起来看结果。
数据落在excel表格里,按照创作者id排列,
每一行是一个匿名词曲人的作品发布记录,
包括发布时间戳和作品时长以及平台標註的风格標籤。
他隨手翻了几页,翻到一个id的时候停了一下。
夜声。
这个名字他听过。
去年有一首歌在各个平台的榜单上掛了三个月,歌手唱的,但词曲署名栏只有两个字:夜声。
当时他在宿舍放过那首歌,苏晏正好在旁边,
听了几秒说了一句这歌写得不错,然后继续写作业了。
方砚没在意。
现在他盯著夜声的发布记录,开始看时间规律。
这个创作者的活跃度不算高,平均每个月一到两首新作品。
但发布时间的分布很集中。
百分之八十三的作品是在凌晨一点到三点之间上传的。
方砚把这个数据单独拉出来,做了一个柱状图。
柱状图的形状在凌晨两点的位置形成了一个尖峰,两侧急剧下降,到早上六点之后几乎归零。
典型的夜猫子型创作者。
方砚看了一眼这个图,没什么特別的感觉。
然后他顺手把发布日期也拉了出来,按月排列了一下。
排完之后他的目光在屏幕上多停了几秒。
他回头看了一眼苏晏的床。
苏晏不在宿舍,出去了,桌上的电脑处於休眠状態,指示灯一亮一灭地闪著。
方砚重新转回自己的屏幕。
他在想一件事。
上个月有一周苏晏连续四天凌晨三点以后才关灯,
方砚有一天起来上厕所的时候看到他还坐在桌前,戴著耳机,屏幕的光映在他脸上,表情专注。
方砚问他在干嘛,他说失眠。
那一周是十月的第三周。
方砚把目光移到屏幕上夜声的发布记录。
十月第四周,夜声发了一首新歌。