能不能开发截图翻译的功能？ | Voters

能不能开发截图翻译的功能？

complete

yochi mada

您好。
如题，能不能开发截图翻译功能？因为有一些网页是无法选中的，另外，有些扫描版的PDF也是无法选中单词或者文本进行翻译的。
因此想和您沟通下，是否可以新增截图翻译的功能？现在很多大模型都能够识别图像了，提取文本再进行翻译，应该是能够实现的。
再次感谢您的优秀的插件给我带来的便利。

allentown

updated the status to

complete

allentown

使用场景是，先自己用截图软件保存，然后用扩展上传本地图片，还是想扩展直接直接截图后翻译？

yochi mada

allentown最好是扩展直接截图翻译，这样比上传本地的图片要效率高一些。有些大模型好像本身就带有文字识别功能的，理论上直接截图翻译应该是能够实现的。谢谢。

allentown

yochi mada: 目前有哪个类似的扩展有该功能，我可以参考下交互

yochi mada

allentown您好，有一个翻译软件叫做STranslate，有使用paddle OCR做截图的识别，然后翻译，如截图，供您参考。GitHub网址：https://github.com/ZGGSONG/STranslate/blob/main/README_ZH.md

另外，我尝试过，在AI的帮助下，直接用gemini的2.0-flash模型，直接识别win+shift+s的系统截图，通过Gemini的图像识别以及文本翻译能力，直接实现截图翻译，也可供您参考。

allentown

yochi mada: 下个版本实现截图翻译。流程是扩展截图然后ocr识别，然后交给各个翻译服务去翻译。没有采用ai识别图片的方案，后者成本比较大

Photo Viewer