当前位置:首页 > 每日看点 > 正文内容

JAVA自己写什么功能可以提升技术?

卡卷网11个月前 (01-17)每日看点186

搭建一个web管理系统,实现100万张图片的管理和搜索,以及10万个种子文件的管理和搜索,当然还有自动爬取图片和种子文件的功能。

搜索功能要支持全文搜索,和 关键词过滤。

把这个管理系统做出来,且能顺畅管理前面说到的这个量级的内容,你的技术就可以达到很不错的水平。



update 2023.09.14晚:

没想到评论的不少,补充一下技术关键点的说明吧,能独自搞定这些技术关键点的,35岁之后下岗的可能性会很低不少。

1.图片的获取

解析网页,批量下载图片,图片内容md5简单防重。一般访问海外的网站比较安全,最多被封ip,不会有其它后果。

2.bt种子的获取

infohash的格式是有32位和40位的,需要归一化,需要从某些url提取解析提取infohash。

需要通过某些网站通过infohash下载种子文件。

3.图片相似度去重及清洗最佳图片

有些图片只是被多加了水印,且层层转换,会存在大量冗余图片,需要一定的算法能力去清洗出低画质图片,尽可能只保留高画质,且尽可能聚合归类。

4.图片exif信息解析,图片与网页内容的关联梳理等。

5.图片内容加密存储,不想直接被查看,或者是想使用网盘存储,AES加密一般是需要的。加密则涉及密码的管理,全局只使用一个密码的安全性是很低的。

6.网页内容的分词处理,过滤不必要的干扰内容。

7.bt种子的解析提取,bt种子内的垃圾文件过滤逻辑处理。

8.网页内容和bt种子内容中的全文搜索(有两个bt搜索网站,一个只支持按bt种子文件名搜索,那种文件名是1的,没法搜索到种子内的优质内容,另外一个搜索网站,有全文搜索功能,但是没有过滤垃圾文件名,搜索结果精度有限)。

9.保存大量文件的目录划分规则,以及大量小文件的存储优化。

10.使用图形识别技术,将有共同特征的图片自动聚合在一起,便于搜索。

11.数据库存储上百万记录之后,可以做下分库分表的练手。

做好这些,既能锻炼技术能力,又能收获大量内容,还能快速精准的找到自己喜欢欣赏的内容,一举多得。


update 2023.09.28 :

我不会白嫖别人的技术,也不会白嫖别人的资源。以后有兴致了再写点文章分享下原创的技术知识点总结。

JAVA自己写什么功能可以提升技术?  第1张

JAVA自己写什么功能可以提升技术?  第2张

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/9530.html

分享给朋友:

相关文章

是什么让你抛弃了 Windows 而转向 Mac?

是什么让你抛弃了 Windows 而转向 Mac?

别的不说,这玩意儿是真抗造啊,我这2012年买的MacBook Pro,依然在用……这台电脑我博士最后两年用来写代码(只写不运行,运行要上集群)和写论文,工作之后就变成生活和娱乐了,因为我一直用架子和外接键盘(颈椎不好)所以电脑看起来很新,...

自媒体如何快速起步?

自媒体如何快速起步?

有两种经验,可供参考。第一种是:现象级的爆火、爆款,这种情况捞到钱,实现财务自由的人并不多,但确实存在。只不过非要说清楚为什么这个账号可以火、可以短时间内赚到普通人一辈子赚不到的钱,他们自己也不一定能说清楚,因为赶上了风口(内外部情况)。举...

你为什么讨厌抖音?

我就被抖音毁了。现在被我媳妇从抖音里拯救出来了。我为什么会这样说?我媳妇硕士在读,我文化程度相对就比较低了。大多数人看抖音其实就是为了一图一乐呵刚开始我也是这样的,我是2017年在朋友的推荐下注册了抖音,刚开始那时候对抖音不太上瘾,一周也就...

WordPress建站同时面向B端和C端,有什么好的解决方案?

这个很容易实现呀,只不过需要自己开发,整体用权限管理就可以实现了,B端和C端是不同用户权限,C端能看到的菜单入口和B端不一样就行了。技术层面实现没问题的,只不过就是看你们的技术能力和投入了 ,这样的需求应该没有现成的开源插件。只能找人定制开...

在 Kubernetes 中,Service 的实现原理是什么,它是如何实现服务发现的?

行,问的这个问题挺有意思,Kubernetes 里 Service 是怎么实现的,服务发现是怎么回事,咱就直说了。这事儿看起来挺玄乎,但掰开揉碎了讲,也就那么回事。你得把这事儿想得简单点,别一上来就被啥术语吓住了——其实全是些搬砖的套路。咱...

鸿蒙系统到底是不是安卓系统?

你好,是的。接下来我给不懂技术的人简单的说一下哄蒙系统的来龙去脉。首先你要知道什么是开源。‌‌开源(Open Source)全称为开放源代码‌,意味着任何人都可以获取和使用软件的源代码,并在遵守版权协议的前提下进行修改和再发布。‌12开源软...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。