当前位置:首页 > 每日看点 > 正文内容

JA自己写什么功能可以提升技术?

卡卷网12个月前 (01-10)每日看点176

搭建一个we,实现100万张图片的和搜索,以及10万个种子文件的和搜索,当然还有自动爬取图片和种子文件的功能。

搜索功能要支持全文搜索,和过滤。

把这个做出来,且能顺畅前面说到的这个量级的内容,你的技术就可以达到很不错的水平。


update2023.09.14晚:

没想到评论的不少,补充一下技术关键点的说明吧,能自搞定这些技术关键点的,35岁之后下岗的可能性会很低不少。

1.图片的获取

解析网页,批量下载图片,图片内容md5简单防重。一般访问海外的较安全,最多被封ip,不会有其它后果。

2.t种子的获取

hash的格式是有32位和40位的,需要归一化,需要从某些l提取解析提取hash。

需要通过某些通过hash下载种子文件。

3.图片相似度去重及清洗最佳图片

有些图片只是被多加了水印,且层层转换,会存在大量冗余图片,需要一定的算法能力去清洗出低画质图片,尽可能只保留高画质,且尽可能聚合归类。

4.图片exif信息解析,图片与网页内容的关联梳理等。

5.图片内容加密存储,不想直接被查看,或者是想使用网盘存储,AES加密一般是需要的。加密则涉及密码的,全局只使用一个密码的安全性是很低的。

6.网页内容的分词处理,过滤不必要的干扰内容。

7.t种子的解析提取,t种子内的文件过滤逻辑处理。

8.网页内容和t种子内容中的全文搜索(有两个t搜索,一个只支持按t种子文件名搜索,那种文件名是1的,没法搜索到种子内的优质内容,另外一个搜索,有全文搜索功能,但是没有过滤文件名,搜索结果精度有限)。

9.保存大量文件的目录划分规则,以及大量小文件的存储优化。

10.使用图形识别技术,将有共同特征的图片自动聚合在一起,便于搜索。

11.数据库存储上百万记录之后,可以做下分库分表的练手。

做好这些,既能锻炼技术能力,又能收获大量内容,还能快速精准的找到自己喜欢欣赏的内容,一举多得。

update2023.09.28:

我不会白嫖别人的技术,也不会白嫖别人的资源。以后有兴致了再写点文章分享下原创的技术知识点总结。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/8533.html

分享给朋友:

相关文章

支付宝碰一碰市场如何?

支付宝碰一碰市场如何?

今年,支付宝又整了新的大活,即无须扫码即能完成支付操作的“支付宝碰一碰”正式登场。下面就来给大家分析分析,这是个什么情况,为什么都在说能赚钱。支付宝碰一下怎么赚钱的?都有谁能赚到这份钱?1.支付宝碰一下原理支付宝碰一下的本质依旧是“条码支付...

为什么微服务一定要有网关?

为什么微服务一定要有网关?

网关一句话总结,网关的作用是上浮公共逻辑,下沉差异逻辑。公共逻辑就是所有接口都需要做的事,比如权限校验,限流算法等,这样业务就只需要关心业务逻辑即可。下面是一个对比图: 当然除了一些公共逻辑外,路由也是网关的核心功能,它可以进行流量转发。...

无人机真的是中国领先吗?

无人机真的是中国领先吗?

巧了这是。捡到了一台大疆。应该是别人飞丢的。在草丛中泡过水,轴承锈死,电池鼓涨已,经没有维修价值了。但作为玩电子的,免不了要把它解剖,研究一番。那么,我们看看它的国产化率能有多少吧。图片说话:解释一下吧。图一,高通 美国图二,MPS: 美国...

如何进行 Elasticsearch 调优实践?

如何进行 Elasticsearch 调优实践?

面试官心理分析这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s ,坑爹了。第一次搜索的...

为什么雷军身上没有酒色财气?

武大建校130周年时,雷军向母校个人捐款13亿。在2023年8月14日晚上七点,雷总在国家会议中心举行的进行第四次年度演讲「成长」:全篇都在谈成长、梦想,这么多年了,始终做到了知行合一,我相信酒色财气可能真不是他所追求的,一直追求的就像他演...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。