利器|全文检索小工具

ripgrep and pdfgrep

Posted by Jinga on December 9, 2020

全文检索小工具

1.问题背景

在工作中经常会遇到这样的场景: 我记得我有在哪个文件中看到过某个概念/关键词,但我怎么才能从文件堆中检索到那个文件呢? 就像在微信读书中搜索某个关键词,可以找到包含这个关键词的相关书籍并准确定位到上下文中。

为了解决这样的问题提高工作效率,我推荐两个小工具:文本搜索神器ripgrep和专攻pdf文本内容检索工具pdfgrep

2.ripgrep安装和使用

安装

$ curl -LO  https://github.com/BurntSushi/ripgrep/releases/download/12.1.1/ripgrep_12.1.1_amd64.deb
$ sudo dpkg -i ripgrep_12.1.1_amd64.deb

使用格式

USAGE:

    rg [OPTIONS] PATTERN [PATH ...]
    rg [OPTIONS] [-e PATTERN ...] [-f PATTERNFILE ...] [PATH ...]
    rg [OPTIONS] --files [PATH ...]
    rg [OPTIONS] --type-list
    command | rg [OPTIONS] PATTERN

举例

$ rg "cheveux"

rg_example.png

红色高亮突出检索关键词

3.pdfgrep安装和使用

pdf是二进制格式,ripgrep在pdf文件中内容检索就失效了,这时该轮到pdfgrep出场了

安装

$ sudo apt install pdfgrep

使用格式

pdfgrep [OPTION…] PATTERN [FILE…]
pdfgrep [OPTION…] [-e PATTERN | -f FILE] [FILE…]

举例

$ pdfgrep -R 'Work'

pdfgrep_example.png

参考:
  1. rg - 当前最快的文本搜索神器
  2. 如何搜索多个pdf文件的内容?
  3. man pdfgrep
  4. https://github.com/BurntSushi/ripgrep
  5. 如何快速搜索文件和文件内容