发布时间:2025-07-29
点击次数: 本文介绍了能破解文本马赛克的Depix项目。其基于线性方框滤波器原理,利用德布鲁因序列生成查找图像,通过匹配像素化区块还原文本,非AI生成式恢复。该项目有字体等限制,用法简单,可结合OCR实现自动化,前人曾用穷举法,作者批判了GAN的生成式恢复。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

像素化(马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息。不过,道高一尺魔高一丈啊……
比如本文介绍了的这个相当有意思的破解马赛克项目Depix,Github上线三天近7000 star,目前,已接近15000 star。
毕竟这个效果看起来相当好了,如果自制数据集配合PaddleOCR识别,恐怕连识别部分都不需要人工干预了
接下来,我们就试着研究下这个项目。
首先,作者介绍了马赛克的原理。作者说道,他要破解的目标是使用普通线性滤波器的像素化结果。我们不妨认为下面这个表情包可以分割成四个大小相同的方块,那么,通过线性滤波器每个方块会得到一个计算结果,再用这个结果填充该方块内输出图像上每个像素点的值。所以,我们会看到,这个笑脸完全在输出结果中完全被隐藏了,这就是马赛克最简单的实现方式之一。
Depix并不是凭空产生的,前人的工作成果给了作者很大的启发。如果在缺少可以还原图像的已知信息,过往的研究方案无一例外地选择了看似最“笨”的办法:如果我要破解某个信用卡号,那就对所有信用卡号它们进行像素化,然后将恢复结果与被像素化的卡号进行比较。我们可以理解这类匹配的方式,类似于穷举。
熟悉GAN技术的读者可能知道,理论上我们可以通过GAN在某种程度上实现马赛克“消除”。但是,用AI技术的话,恢复的马赛克区域本质上是生成的,并不是真正的原始结果。本文中,作者对此也批判了一番:The AI generates faces that result in the same image when pixelized, but the face it recovers is not the original.
首先明确研究的场景还是有限制的,这是基于文本的马赛克恢复研究。
由于线性方框滤波器是一种确定性算法,对同样的值执行像素化通常会产生同样的像素化 block。使用同样位置的 block 对相同文本执行像素化,会得到同样的 block 值。我们可以尝试像素化文本来找出匹配的模式。更幸运的是,我们还可以把每个block或block组合看作一个子问题。
简小派
简小派是一款AI原生求职工具,通过简历优化、岗位匹配、项目生成、模拟面试与智能投递,全链路提升求职成功率,帮助普通人更快拿到更好的 offer。
123
查看详情
项目的局限:作者没有选择创建潜在字体的查找表。该算法要求在相同背景上具备相同的文本大小和颜色。
最终解决方案:使用待处理字符的 De Bruijn sequence (德布鲁因序列),将其粘贴到相同的编辑器中,然后截图。该截图可以用作相似 block 的查找图像。
问题:什么是De Bruijn sequence?到这个网站试试看就知道啦。De Bruijn Sequence Generator for Faster Shift Register Code Bruteforcing
德布鲁因序列包括待处理字符的所有双字符组合。这很重要,因为一些block会重叠两个字符。找出恰当的匹配需要搜索图像中具备相同像素配置的block——换句话说,穷举地更完善了,这样将像素化的block与匹配block对照的时候,匹配上的概率更高。双字符德布鲁因序列:
在以下测试图像中,Depix 算法无法找到「o」的一部分。这是因为在搜索图像中,搜索 block 还包含下一个字母(「d」)的一部分,但在原始图像中这里有个空格。——换言之,这个算法有个比较大的缺点,那就是对“匹配”要求比较苛刻
该项目用法相当简单,一行命令搞定:
python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.pngIn [3]
# !git clone https://github.com/beurtschipper/Depix
Cloning into 'Depix'... remote: Enumerating objects: 89, done. remote: Total 89 (delta 0), reused 0 (delta 0), pack-reused 89 Unpacking objects: 100% (89/89), done. Checking connectivity... done.In [1]
%cd Depix/
/home/aistudio/DepixIn [ ]
!python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png
掌握了Depix,我们也可以根据算法的要求准备自己的德布鲁因序列与带测试马赛克截图。一个关键点是,字体大小一致。这个简单操作实际做起来还有一丢丢麻烦。
In [6]!python depix.py -p images/testimages/21.png -s images/searchimages/03.png -o output3.png
INFO:root:Loading pixelated image from images/testimages/21.png INFO:root:Loading search image from images/searchimages/03.png INFO:root:Finding color rectangles from pixelated space INFO:root:Found 62 same color rectangles INFO:root:45 rectangles left after moot filter INFO:root:Found 11 different rectangle sizes INFO:root:Finding matches in search image INFO:root:Removing blocks with no matches INFO:root:Splitting single matches and multiple matches INFO:root:[2 straight matches | 38 multiple matches] INFO:root:Trying geometrical matches on single-match squares INFO:root:[4 straight matches | 36 multiple matches] INFO:root:Trying another pass on geometrical matches INFO:root:[4 straight matches | 36 multiple matches] INFO:root:Writing single match results to output INFO:root:Writing *erage results for multiple matches to output INFO:root:S*ing output image to: output3.png
这里用某知名聊天软件的截图马赛克功能做了个尝试,手法比较粗糙,把上下左右行的字符给混进来了,导致效果不太好,不过,也许火眼金睛的读者能猜出加密的什么。哈哈。
以上就是打码就安全了?像素化(马赛克)破解技术Depix简介的详细内容,更多请关注其它相关文章!
# git
# python
# 自己的
# 一言
# 布鲁
# 穷举
# 打码
# 中文网
# udio
# notepad
# 聊天软件
# ai
# windows
# 南京优化平台有哪些网站
# seo锻炼方法
# 嘉定区官方网站优化方案
# 孝感seo公司咨询23火星
# 出名的网站seo推广需要多少钱
# 苏州网站推广策略优化
# 旅游营销推广的对象
# 将公司网站建设成
# 行业资讯网站怎么推广
# seo理念是什么
# 我们可以
# 有个
# 是一种
# 卡号
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求
小艺将具备大模型能力,鸿蒙4加速AI普及之路
研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
杀入生成式AI的亚马逊云科技,能否再次生成未来?
速途网络成立“人工智能专家委员会”5位中美博士加盟
读创正式上线“读创AI聊”功能
谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务
关于开展“与AI共创未来”——2025年全国青少年人工智能创新实践活动的通知
网易加速行业AI大模型应用,将覆盖100多个应用场景
美妆行业在AI时代蓬勃发展
百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧
通用医疗人工智能如何革新医疗行业?
“可用”“有用”的讯飞星火认知大模型将亮相世界人工智能大会
“木头姐”:特斯拉的人工智能训练——“赢家通吃”的机会
GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型
统信深度deepin成立 AI SIG 社区,共同提升 Linux 下 AI 体验
微盟宣布联合腾讯云共建行业大模型:加快激活AI大模型智能应用
人工智能自己玩自己
全新“AI助手”!讯飞星火助手中心人机协作共创新生态
西班牙小鲜肉*视频在网上疯传,本人发文澄清:是AI换脸的假视频!
谷歌将使用公开信息训练 AI 模型,构建更强大的自家产品
IBM将模拟计算用于人工智能,重塑AI计算
AMD在ChinaJoy展示全新的锐龙AI笔记本,开创了人工智能领域的新时代!
阿里云推出通义万相AI绘画大模型
对话式论文阅读工具PaperMate上线,综述细节AI告诉你
央视报道车载人机交互技术!MWC上海魅族表现亮眼,现场热火朝天
苹果AR头显商标与华为撞车,在中国或改名
再度重仓 AI 赛道,SaaS 巨头 Salesforce 扩大 AIGC 风投基金规模
小艺主导智慧交互升级,借助AI大模型增强能力
2025智源大会AI安全话题备受关注,《人机对齐》新书首发
美图公司影像节或发布AI设计新品
谷歌 Gmail“帮我写电子邮件”AI 功能开始向安卓和苹果设备推广
讯飞星火大模型实现升级 助力通用人工智能人才培养
当TS遇上AI,会发生什么?
联想举办2025创新开放日,展出260余项算力及AI产品技术
云南首例达芬奇机器人微创心脏手术成功开展
五个IntelliJ IDEA插件,高效编写代码
全国青少年无人机大赛重庆市选拔赛开赛 1252名中小学生参加
深剖Apple Vision Pro中暗藏的“AI”
智能技术提高现代商业运营的7七种方式
微软向美国政府提供GPT大模型,如何保证安全性?
AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
Meta发布语音AI模型 Voicebox 助虚拟助手与NPC对话
美图设计室2.0什么时候上线
2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组
到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启
人工智能“Aria”现身 Opera浏览器100版本更新:新功能“标签岛”
为什么很多人对纽约《人工智能招聘法》感到生气?
ChatGPT设计出的第一个机器人来了!【附人工智能行业预测】
研究预测HPC支持的人工智能增长迅速