新世界的大门

因此幻想是世界,谁若懂得,谁就会歌唱

新世界的大门
新世界的大門(Logo)

今天是圣诞节。学校门口在一周前就摆了个圣诞树🎄。每层内还另有一棵,挂着所有人写的「新年愿望」。

还记得 17 年的那场大雪,盆景园、护城河畔,静谧的雪里心情虽不舒畅,但却也能有暂时的慰藉。当时的焦虑大部分现在已经随风而逝,但谁又能想到今天的境遇呢?

18 年的圣诞好像在听「Christmas」(网易云音乐)。应该是自从那年,能在公共场合看到圣诞树已是一件十分稀有的事情。我在这意外的拥抱中,也懒散而且舒适,从白天以至初夜的焦虑,全给这圣诞节的空气一扫而空了,只觉得天龙人们歆享了牲醴和香烟,都醉醺醺的在空中蹒跚,预备给(如今再也不是)小镇的做题家们以无限的幸福。📝

今天做听力的时候,有第四道题的对话是一个人在广告上看到了修车的广告,到这里来修车。选项问这是什么地方:a parking lot, a factory or a garage。正确答案是 garage,因为有一项意思是汽车修理间。

🔑 [countable] a place where vehicles are repaired and where you can buy a car or buy petrol/gas and oil (兼营汽车销售、修理及加油的)汽车修理厂

考熟词生义总比奇怪题目不知所云要好。

PS: 今天再去机房考试,学校已经 ban 了网络连接。发现进入考试后可以通过极域电子教室的浮动面板调出资源管理器,然后新建 .rtf 文件,用写字板打开,按 PrtScr 截图后粘贴用来应付听后转述。📝


写于 Telegraph,2020 年 10 月 23 日。如果你看不到图片,说明你无法访问 telegra.ph

第一次写这种文章。在除夕发布,并不是因为一时兴起,也非构思很久,只是学业繁忙,只有在假期中间,才有心情和时间将一年来的思绪付诸文字。

这才知道我的全部努力 不过完成了普通的生活。

        ——穆旦《冥想》

即将过去的一年,大概可以说是一生中改变最大的一年。

学业

山重水复

高二的下半学期紧张地开始。三月份中有江苏省最后一届「小高考」。虽然政策有所变化,但为了防止学测成绩被高校用作录取的依据,复习的要求还是十分紧的。那几个星期,早读常常用来死磕化学式,体育课会拿着地理政治的讲义独自站在校园无人的一隅。但这些尝试最后似乎都徒劳无功,到了考试的时候化学的大题目一如既往地看不懂,政治明知要求背诵的句子依旧只能记得几句。只好带着疑惑、不解和糟糕的心情,进入了接下来的生活。

新的转机

在友人的建议下,去了市里的医院。先是一所综合性的,但最后也只是「心理咨询」;随后到精神专科医院,开了SSRIs。刚开始服用的时候副作用很大,但效果也很显著。呼吸到多年以来不曾有过的新鲜平和的空气,生活还是有很大改善的。但是,随着药效的减弱,渐渐觉得还应该有 其他的因素:ADD。

柳暗花明

之后就到了北京的安定医院。本以为确诊无望,但跟医生说了「分心」的情况,做了量表,最后大概是如愿以偿地拿到了治疗多动症的药物。因为是精神类药物,还得按月去拿,最后只得在京东上购买替代品。 分班考试靠着一学年的稳定的分数进入了同学科中最好的一个班。 鼓起勇气报名参加了运动会,长跑之后瘫在草坪上,有一种前所未有的喜悦。然后只记得同学把我搀扶回去时的温暖。 虽然能够减轻一时的杂念,药物的副作用还是很大的。并不是说身体上的那种疼痛,而是精神上一定的依赖性,还有恶心的感觉,即使心里深知今后不可能一辈子都依赖在这些东西上。 但是长久以来一直困扰我的疑惑终于能解决,明白了自身的长处(?)和短处后,能够直面恐惧的根源,这样的变化还是很不错的。就像知乎上一位答主所说的吧:

接受不好的可能性和残酷的现实,明白很多梦想都会落空,很多奋斗注定白费,很多努力永远没有结果,很多能力你没有就是没有。 但还是把能做的都做了吧。

生活

背了点日语。可惜散步的时候听力是懵的,最后果然因为听力没有过。 没写什么有技术含量的代码。只是做了几个无聊的 Telegram 机器人,还有自用的小工具。 也没读几本书,不过电影、剧貌似看了不少。大部分时间还是耗费在了网上。 暑假在华北玩了一圈。

啊啊,最重要的是养了一只猫。当初在各种昵称中拿捏不定,最后还是让 ta 像《我是猫》中的那只猫一样,「名前はまだ無い」。猫最近喜欢和我安静地呆在空调房中。不由得想起买回来只有两个月大的时候的纯真的眼神。如今已经长长、长胖了许多。 今年听的最多的歌是《春愁》、改编的《巴赫平均律》。 ## 成长

虽然说是变化最大的一年,但是这些变化很难说是我自己通过努力促成的。

与 2018 时相比,大概最为不同的是价值观的改变。与那时盲目羡慕别人的生活相比,能够清晰地辨明那其实并不是我真正想要的,会在看到别人与我的不同之处后一笑置之。虽然说人各有志,但是也难免不将别人的美好生活内化为自己的追求,只是在更加了解自己后,会更加坚定地朝着既定的目标努力。

未完待续

上次春节的时候,在江边的渡口和家人游玩,期间和🌸聊着天。流感的奇怪氛围中,今年心情一样复杂不同于往年。不知道一年后走过的自己,借用黑塞的话说——

将会以怎样惊异的目光回顾 ta 走过的曲折复杂、摇摆不定的生活途径,会如何对此事的自己投以鼓励的、责备的、同情的、快乐的微笑!

上高中以来,学校一直订了一份「报纸」当作业用,叫《学英语》。最近做题时发现报纸与时俱进,多了几个二维码,分别是微信公众号还有「扫一扫 查答案」。

目标网站

通过二维码扫描出来的结果是上一期的答案。网页的地址长这样:

url.png

简直不要太直白。

首先在网站逛了一圈,PC 版风格看起来仍然是很老旧的那种;网站首页是有专门的答案分区,但是点进来的答案很少。显然,我所需要的答案没有文章列表,必须要经过扫描二维码拿到。

然后便是尝试改地址:稍稍增减 id 参数,可以看到最近发的文章:image.png

发现只有几期的答案是连在一起的,其余的有很多这家报社的其他产品的内容。这些答案的排布也并不是那么有规律,比如下一个 id 的是上上期的答案。那么,只需要爬取附近的每个页面,然后把符合要求的找出来就行了。

开发环境

Google 提供了免费的 Jupyter Notebook 环境—— Colab,无需配置,开箱即用。进入 后创建一个新的 PYTHON3 笔记本。

或者,你也可以下载 ANACONDA 并安装。接着执行命令

1
2
3
$ pip install pipenv
$ pipenv shell
$ jupyter notebook

这之后默认浏览器会打开本地的 Jupyter Notebook。

我们需要安装 requests_html 做爬虫。

requests-html 是基于现有的框架 PyQuery、Requests、lxml、beautifulsoup4 等库进行了二次封装,作者将 Requests 设计的简单强大的优点带到了该项目中。

1
!pip install requests_html

Jupyter Notebook 中,以 ! 开头的行会被解释成命令。

爬取和解析

这种 CMS 一般都没什么反爬措施,连 X5 浏览器 UA 都不需要伪造。所有网页的标题都是相同的,所以爬取每个页面内的标题就好。

image.png Chrome 内右键目标元素,点「检查」,右键 Elements 中高亮的颜色,复制选择器。

1
#dummybodyid > div.contentbox > h3

对下面的答案图片如法炮制,它们的选择器分别是:

1
2
3
4
#dummybodyid > div.contentbox > div > p:nth-child(1) > img
#dummybodyid > div.contentbox > div > p:nth-child(2) > img
#dummybodyid > div.contentbox > div > p:nth-child(3) > img
#dummybodyid > div.contentbox > div > p:nth-child(4) > img

页面最后一般会有 doc 文档可以下载,但是最近没有了。

然后便是遍历每个页面了。

1
2
3
{'34210': '19-20上高三江苏第9期A版参考答案', '34211': '19-20上高三江苏第8期A版参考答案', '34212': '19-20上八年级★云南第10期听力录音', '34213': '19-20上八年级邵阳第10期听力录音', '34214': "悦听悦读 The world's first artificial moon", '34215': '悦听悦读Superheroes from Asia', '34216': '19-20上八年级广东第10期听力录音', '34217': '19-20上外研八年级嘉兴第9期听力录音', '34218': '19-20上外研八年级嘉兴第10期听力录音', '34219': '19-20上外研八年级嘉兴第11期听力录音', '34220': '19-20上外研八年级嘉兴第12期听力录音', '34221': '19-20上八年级★赤峰第1期听力录音',
…,(省略一部分)
'34966': '19-20上九年级宁波期末检测一本通综合测评(五)听力录音', '34967': '悦听悦读Real-life Dora', '34968': '19-20上高三江苏第14期A版参考答案', '34969': '19-20上高三江苏(N)第15期听力录音', '34970': '19-20上高三江苏(N)第14期B1-B4版参考答案', '34971': '19-20上高一第24期A4版听力练习录音', '34972': '19-20上高三江苏第15期A版参考答案', '34973': '19-20上高三江苏(N)第16期听力录音', '34974': '19-20上高三江苏(N)第15期B1-B4版参考答案', '34975': 'Jane and Sara want to go skating(I)', '34976': 'Jane and Sara want to go skating(II)', '34977': '19-20上八年级(J)第17期听力录音', '34978': '19-20上八年级(J)第18期听力录音', '34979': '19-20上八年级(J)第19期听力录音', '34980': '19-20上八年级(J)第20期听力录音', '34981': '悦听悦读 An ancient Chinese story', '34982': '悦听悦读 Empty-City Strategy', '34983': '悦听悦读Hearing loss, a major problem for teenagers', '34984': '悦听悦读FOLLOW ME: Hearing loss, a major problem for teenagers', '34985': '故事乐园 The ice cream', '34986': "故事乐园 It's Mr Green", '34987': '悦听悦读A special fashion show', '34988': '悦听悦读Two cute girls', '34989': '19-20上八年级曲靖第15期听力录音', '34990': '19-20上七年级★福建第15期听力录音', '34991': '悦听悦读 Max Einstein: The Genius Experiment', '34992': '19-20上九年级(XJ)第9期听力录音', '34993': '19-20上九年级(XJ)第10期听力录音', '34994': '19-20上九年级(XJ)第11期听力录音', '34995': '19-20上九年级(XJ)第12期听力录音', '34996': '19-20上七年级★福建第16期听力录音', '34997': 'Bill and Kitty', '34998': '19-20上八年级曲靖第16期听力录音', '34999': '悦听悦读Flying car'}

Demo

learningEnglishFetch.py

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

你好,世界!

两年前的时候用 Wordpress 陆续搭过几个博客,然而却并没有写多少文章;随后 VPS 到期,这事也就不了了之。现在在这里暂且再搭一个,也不想去瞎折腾了。

0%