当前位置:首页 > 每日看点 > 正文内容

JA自己写什么功能可以提升技术?

卡卷网10个月前 (01-10)每日看点147

搭建一个we,实现100万张图片的和搜索,以及10万个种子文件的和搜索,当然还有自动爬取图片和种子文件的功能。

搜索功能要支持全文搜索,和过滤。

把这个做出来,且能顺畅前面说到的这个量级的内容,你的技术就可以达到很不错的水平。


update2023.09.14晚:

没想到评论的不少,补充一下技术关键点的说明吧,能自搞定这些技术关键点的,35岁之后下岗的可能性会很低不少。

1.图片的获取

解析网页,批量下载图片,图片内容md5简单防重。一般访问海外的较安全,最多被封ip,不会有其它后果。

2.t种子的获取

hash的格式是有32位和40位的,需要归一化,需要从某些l提取解析提取hash。

需要通过某些通过hash下载种子文件。

3.图片相似度去重及清洗最佳图片

有些图片只是被多加了水印,且层层转换,会存在大量冗余图片,需要一定的算法能力去清洗出低画质图片,尽可能只保留高画质,且尽可能聚合归类。

4.图片exif信息解析,图片与网页内容的关联梳理等。

5.图片内容加密存储,不想直接被查看,或者是想使用网盘存储,AES加密一般是需要的。加密则涉及密码的,全局只使用一个密码的安全性是很低的。

6.网页内容的分词处理,过滤不必要的干扰内容。

7.t种子的解析提取,t种子内的文件过滤逻辑处理。

8.网页内容和t种子内容中的全文搜索(有两个t搜索,一个只支持按t种子文件名搜索,那种文件名是1的,没法搜索到种子内的优质内容,另外一个搜索,有全文搜索功能,但是没有过滤文件名,搜索结果精度有限)。

9.保存大量文件的目录划分规则,以及大量小文件的存储优化。

10.使用图形识别技术,将有共同特征的图片自动聚合在一起,便于搜索。

11.数据库存储上百万记录之后,可以做下分库分表的练手。

做好这些,既能锻炼技术能力,又能收获大量内容,还能快速精准的找到自己喜欢欣赏的内容,一举多得。

update2023.09.28:

我不会白嫖别人的技术,也不会白嫖别人的资源。以后有兴致了再写点文章分享下原创的技术知识点总结。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/8533.html

分享给朋友:

相关文章

4000以下的手机有没有推荐的啊?

4000以下的手机有没有推荐的啊?

可以选择标准版的旗舰机型:vivo X100s、一加12、OPPO Find X7、小米14、iQOO 12;也可以选外观时尚的自拍影像机型:vivo S19 Pro、realme GT 5 Pro、荣耀 200Pro、小米 Civi 4...

报名的网课分期付款怎么退?

你在你分期付款的订单下面有客服电话,直接打电话描述一下你的问题,你可以告诉他你是被恶意绑定的,在不了解有退学条件这一说的情况下报的课程,可能遇到消费者诈骗了,不承认有退学金,说是霸王条款,诈骗消费者,你若分期了先把自动续费关了,别让自己个人...

都是前端框架,为什么用 React 的人会有优越感?

都是前端框架,为什么用 React 的人会有优越感?

上家公司一直搞react,最近第一次写个vue3项目。老板朋友来了看了下页面说:这用vue写的吧。我:是...老板朋友:一看就知道是vue做的。这tm你看一眼页面就知道用的啥框架?这感觉就是,我一直用苹果,偶尔用了下华为打电话,有个人离老远...

腾讯云为何在云服务市场败给了阿里云?

IDC领域,2010年以前,万网、新网互联、新网,三家公司瓜分天下,其中万网市场份额最高,排名第一。当时,万网的域名是http://www.net.cn,通过该域名就可以判断万网的地位。2010年阿里云成立,直接收购了万网,大量用户直接流向...

是不是从Java培训班出来的人都被淘汰了?

真实个人经历。我就是从培训班出来的,但没有学完就跑出来了。当我明白什么人不管什么基础都能进培训班进行培训,学到什么程度都能保证他们包就业,我就知道不正常。我自己是大三下的时候去的,考研考到一半感觉无望,想抓紧时间学习技术,利用应届生身份准备...

你见过哪些有趣的偏微分方程组?

你见过哪些有趣的偏微分方程组?

说说我一直在做的一个偏微分方程系统吧,该模型为生物领域的趋化性(chemotaxis)模型,也叫Keller-Segel模型,由该二人于1971年左右提出,用于刻画细胞或者细菌的趋化机制。解释一下趋化性(chemotaxis):趋化性是指单...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。