视频语音文字识别转换 (视频翻译和配音工具)
https://github.com/TutuBinary/pyvideotrans
一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。
主要用途和使用方式####
【翻译视频并配音】根据需要设置各个选项,自由配置组合,实现翻译和配音、自动加减速、合并等
【识别字幕不翻译】选择视频文件,选择视频源语言,则从视频【语音中识别出文字】并自动导出字幕文件到目标文件夹
【提取字幕并翻译】选择视频文件,选择视频源语言,设置想翻译到的目标语言,则从【视频语音中识别出文字】并翻译为目标语言,然后导出双语字幕文件到目标文件夹
【字幕和视频合并】选择视频,然后将已有的字幕文件拖拽到右侧字幕区,将源语言和目标语言都设为字幕所用语言、然后选择配音类型和角色,开始执行
【为字幕创建配音】将本地的字幕文件拖拽到右侧字幕编辑器,然后选择目标语言、配音类型和角色,将生成配音后的音频文件到目标文件夹
【音视频识别文字】将视频或音频拖拽到识别窗口,将识别出文字并导出为srt字幕格式
【将文字合成语音】将一段文字或者字幕,使用指定的配音角色生成配音
【从视频分离音频】将 ...
OCR离线文字识别库
完全开源免费的文字识别库
离线文字识别软件
https://github.com/TutuBinary/Umi-OCR
离线文字识别库 PaddleOCR-json (兼容性不好,性能高)
https://github.com/TutuBinary/PaddleOCR-jsonhttps://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6 (原库)
离线文字识别库 RapidOCR-json (兼容性好,性能中等)
https://github.com/TutuBinary/RapidOCR-jsonhttps://github.com/TutuBinary/RapidOcrOnnx (原库)
数模转换DAC R-2R电阻梯网络 阶梯电阻
前言DAC(Digital to Analog Converter)是将数字信号变换为模拟信号的器件,在数字电路中得到广泛应用。数字电路中使用数字信号处理数据,可以使电路获得更高的抗干扰能力,同时数据处理方法也更加灵活,但在信号的输入和输出端,反馈信号与被控对象控制量仍然可能是模拟信号,模拟输入量可以通过ADC(Analog to Digital Converter)变换为数字信号,在信号输出端使用DAC将数字信号还原为模拟信号。
数字信号转换为模拟信号通常有两种方式
使用集成式DAC芯片 (成本高, 精度高)
使用 R-2R梯形网络 (成本低, 架构简单, 精度也比较低)
R-2R 电阻梯网络示意图
R-2R电阻梯网络直接将并行数字符号/字转换为模拟电压。每个数字输入(b0、b1 等)都会将其自己的加权贡献添加到模拟输出中。该网络具有一些独特且有趣的属性。
轻松扩展至任何所需的位数
仅使用两个电阻值,可轻松准确地制造和集成
无论位数多少,输出阻抗都等于 R,从而简化滤波和进一步的模拟信号处理电路设计
如何分析 R-2R 网络?分析 R-2R 网络会让您回想起在本科 ...
RGB888 转 RGB565 抖动补偿
RGB565 和 RGB888是两种不同的颜色表示方式,在计算机图形学和显示领域中被广泛使用。RGB565使用16位数据表示一种颜色,每个颜色通道(红色、绿色、蓝色)使用5位、6位和5位的数字分别表示,而RGB888则使用24位数据表示一种颜色,每个颜色通道都使用8位数字。相互转换时,需要对颜色值进行折算和补偿,以确保转换后的颜色与原始颜色尽可能接近。
RGB888 -> RGB5651.取RGB888中第一个字节的高5位作为转换后的RGB565的第二个字节的高5位
2.取RGB888中第二个字节的高3位作为转换后的RGB565第二个字节的低3位
3.取RGB888中第二个字节的第4--6位,作为转换后的RGB565第一个字节的高3位
4.取RGB888中第二个字节的第三个字节的高5位作为转换后的RGB565第一个字节的低5位
可以看出24位色转换为16位色时, 低位会被舍弃, 相应的精度也会丢失
原始的 24bit 图片
没有抖动的 16bit 图片 (有阶梯状条纹, 色彩不连续)
抖动后的 16bit 图片
参考资料:
https://stackove ...
各种常用小工具汇总
STranslate OCR 免费软件
https://github.com/STranslate/STranslate
tts-vue 文字转语音工具 (微软接口)
https://github.com/TutuBinary/tts-vue
无限画板
https://excalidraw.com/
https://github.com/TutuBinary/Lorien
天若OCR文字识别V4.49
https://github.com/TutuBinary/tianruoocr_last.git
Snipaste 截图软件
https://www.snipaste.com/
CLaunch 快捷启动软件
https://hp.vector.co.jp/authors/VA018351/index.html
Everything 搜索软件
https://www.voidtools.com/zh-cn/
ShadowsocksR-Windows
https://github.com/HMBSbige/Shadowsoc ...
什么是外包? 二方外包和三方外包的区别
一、背景一转眼,又到了金三银四的跳槽 & 求职季。
在 IT 行业,跳槽就离不开一个词,那就是外包。
可以说,每一位 IT 人都接触过外包,甚至参与其中。而多数IT职场萌新,都面临着大厂外包,还是小公司的绝望抉择。
虽然很多人虽然抵制外包,但他们往往对外包只有比较直观、碎片的认识。
网上针对 IT 外包的资料,很少很少,而且大多比较零碎。
我恰巧对外包算比较有经验,所以我想谈一谈外包。希望能给需要的小伙伴,一些参考与帮助。
二、分析1、什么是外包?为了更好地分析,我们需要了解什么是外包。外包是一种将目标,委托给其他组织的管理模型。外包有很多种,如项目外包、产品外包、工程外包等等。而我们最为关心的,则是人力资源外包。这样说比较抽象,我来举个例子。
项目外包:为了完成某个项目,出于进度、成本,甚至是风险转移的考量,将项目拆分一部分(如非核心部分)交给其他个人/组织。比如猪八戒网上的一些项目,就是这样的项目。
产品外包:多数出于成本考量,将部分产品外包给其他个人/组织。比如战神5将部分场景、人物模型外包给外部团队完成。工程外包:多数出于成本、风险、进度等考量,将 ...
Sphinx 如何生成 PDF 文档 [2024.3.1]
Sphinx 如何生成 PDF 文档 [2024.3.1]前言sphinx + rst 编写文档有以下优势:
简单易学
格式多样化: html/pdf
便于维护 (git)
跨平台
rst 标记语言可以很容易的输出 html 页面, 但是想要输出 pdf 文档 会麻烦一点,这里就教大家如何生成 pdf 格式的文档。
rst 转 PDF 原理: 首先将 rst 转换为 tex, 再由 tex 转换为 PDF
下面会教两种方法给大家:
通过 texlive 和 TeXstudio 生成 pdf 文档
通道 readthedocs 代理服务器自动发生成 pdf 文档
第一种方法最靠谱, TeXstudio 软件在生成 pdf 文档时可以提示错误原因,方便找问题
第二种方法最简单,不需要再电脑上搭建环境,一旦出现错误很难查找问题所在
通过 texlive 和 TeXstudio 生成 pdf 文档
texlive 提供 tex 文档编写的各种依赖环境, 安装包比较大,安装时间久
TeXstudio 提供 tex 文档编辑器,编辑、编译 tex 文档特别方便
这种方式 ...
USB协议分析(wireshark抓包)
USB资料汇总,这个在线资料算是USB规格书的提炼,方便大家查阅
https://www.beyondlogic.org/usbnutshell/usb1.shtm
本文将在windows下从wireshark抓包的角度对USB协议进行分析,可以同时参考以下内容进行学习: stm32f4USB项目开发详解
USB 在抓包的过程中我的电脑上一共连接了3个usb设备,分别为一个键盘、一个无线鼠标接收器以及一个U盘
下面是我的设备管理器的显示,由于电脑上除了我外连的三个usb设备之外还有电脑内的主机控制器和根集线器等设备,所以设备管理器显示有6个。
usb设备是三段地址描述, 第一个是总线,第二个是设备地址,第三个是端口. 我们可以使用这种方式在wireshark内进行过滤
我们可以看到图中有一部分数据为 USB URB , 那么什么是URB呢?根据microsoft的官方文档我们可以看到URB的定义。相关网页
通用串行总线 (USB) 客户端驱动程序无法直接与其设备通信。 相反,客户端驱动程序创建请求并将其提交到 USB 驱动程序堆栈进行处理。 在每个请 ...
画图、绘图工具
excalidraw虚拟手绘风格白板
https://github.com/excalidraw/excalidrawhttps://excalidraw.com/
drawiodraw.io是一个在线作图网站,功能很多,思维导图、流程图、网络图等等,电路图也有。里面的很多图都可以设置成草图样式,挺酷炫的。
https://app.diagrams.net/
LorienLorien 是一款无限画布绘图/笔记应用程序,专注于性能、小型保存文件和简单性。 适用于 Windows、Linux 和 macOS,支持中文。
https://github.com/mbrlabs/Lorien
波形图绘制工具WaveDromWaveDrom 根据简单的文本描述绘制时序图或波形。他有在线版本和离线版本,可以从它的官网下载安装版本。
https://wavedrom.com/editor.html
TimeGenTimeGen是一款简单实用的画时序图工具,用户可以快速的通过该软件进行时序图的创建,软件具有矩形或圆形边缘的轮廓文本框,方便用户对各种模式的时序图进行制作 ...
MCU动态加载函数的方法
前言我们都听说过 静态库和动态库 , 静态库大家都应该比较清楚,在单片机开发的时候,也经常用到。
动态库在 windows 和 linux 下很常见,例如: Windows中的dll,Linux中的so,可以将代码动态地从其他的存储介质,动态加载到RAM中
而动态库在单片机领域就很少见了
第一种动态库方案
参考链接 : https://whycan.com/t_8607.html
最近尝试了一下wifi/bt soc上,动态加载用户应用的方式。又学到很多没用的知识。
基本需求
应用需要方便编译,使用比较通用的格式
elf:还有谁?
应用代码部分最好不占用ram,XIP方式运行
elf: 呃呃呃,你再说一遍?
用户开发简单,和普通的c一样,甚至可以用其他语言,rust、go等等,反正能编译成elf就行
elf: smile
支持cortex-m等MCU芯片
cortex-m: 纳尼
全兼容,基于新版本编译的同样代码,可以在旧版中使用,反过来也一样
elf动态加载、地址无关、cortex-m
gcc编译器使用-fPIC,产生的是got-b ...







![Sphinx 如何生成 PDF 文档 [2024.3.1]](/img/sphinx.png)







