我用python爬虫找到了不想告诉我她知乎ID的妹纸的ID…….
在我做了这件事情之后 , 她觉得我越来越懂她了 , 嘻嘻
有一天 , 我发现我心仪已久的妹纸在朋友圈里分享了知乎专栏的文章 , 就知道她也刷知乎 . 如果在知乎上关注她 , 我就能知道 , 她最近关注什么 , 心里想些什么 , 了解了解她喜欢的方面 , 还能作为谈资 , 简直太赞了 (*^^)v .
但是输入她的名字…… 在知乎上根本找不到好吗 (?`灬′?)
我们两个聊天的时候 , 刚好说到了她分享的那篇文章 ,
我很自然的说: “知乎上你用的不是真名呀, 就我这么天真用了真名..”
她笑着说:”那个可以改呀” ,
“凭什么知乎团队不让我改啊!!! “,我答道,” 不如我们互粉吧^_- ”
哎 , 于是她打开zhihu , 看了看我的主页 , 并没有关注我…… 可能是赞太少了吧… 达不到她的要求 , 或者她不想让我知道她在看什么吧 , 也许她希望自己的知乎是交浅言深 , 不希望被身边人看见… (?-﹏-?) 失望.
我回去想了想 , 她说名字可以改 , 那她可能以前也用的是真名 , 找到破绽了!
知乎的名字可以改 , 但是id是改不了的 !
每个人的主页地址 , people后面那个就是TA的id,
http://www.zhihu.com/people/zhang-san-12-45
例如张三同名很多 , 后面就会加上数字. 她的名字拼音相同的较多 , 我试了一下 , 这个数字是不超过100的. 它的组合方式有 zhang-san , zhang-san-1 zhang-san-12-43 依次类推.
好 , 现在我就可以开始寻找她的账号了! 既然她改名了 , 那她名字满足的条件一定是: 昵称的拼音不是真名. 这个用pypinyin模块可以解决 , 这样子 , 需要我人工查看的主页就少很多了.
# coding: utf-8
from zhihu import User
from pypinyin import pinyin, lazy_pinyin
import pypinyin
user_url = ‘‘
user_id = ‘‘
l = [u‘bu‘, u‘xu‘, u‘kan‘]
#这里是她名字的拼音, 还是不要暴露她的好, (*/ω\*)
for num in range(100): #先在 -100以内搜索
try:
user_url = ‘http://www.zhihu.com/people/bu-xu-kan-‘ + str(num)
user = User(user_url)
user_id = user.get_user_id()
if l != lazy_pinyin(user_id.decode(‘gbk‘)): #看看她有没有用原名
print user_id, ‘ ‘, num
except:
pass
for i in range(100):
for j in range(100): #在 -100-100以内搜索
try:
user_url = ‘http://www.zhihu.com/people/bu-xu-kan-‘ + str(i) + ‘-‘ + str(j)
user = User(user_url)
user_id = user.get_user_id()
print user_id, ‘ ‘, i, ‘-‘, j
except:
pass
爬了好久 , 结果出来了 , 这些昵称不多 , 我翻翻他们的主页就幸运地找到了我心仪的妹纸:
XXXXXXXX 26
XXXXXXXX 27
XXXXXXXX 42
XXXXXXXX 72
XXXXXXXX 94
she is here! 6 - 36
XXXXXXXX 6 - 76
XXXXXXXX 7 - 86
XXXXXXXX 10 - 35
XXXXXXXX 28 - 67
XXXXXXXX 32 - 28
XXXXXXXX 32 - 66
XXXXXXXX 34 - 75
在我打开她的主页之后 , 我发现她喜欢科幻 , 也对推理小说感兴趣 , 关注穿衣打扮方面 , 符合我的胃口呀 . 最近呢 , 她关注情感方面的问题变多了 , 我不知道是不是因为最近我和她联系变频繁了 , 激起了她一些感觉 , (/ω\)
我会加油哒~
原文地址:http://blog.csdn.net/qq_21970857/article/details/46536923