MCP Servers

A collection of Model Context Protocol servers, templates, tools and more.

M
MCP Documents Work

MCP server by TheBatashev

Created 8/1/2025
Updated 5 months ago
Repository documentation and setup instructions

MCP Document Tools

MCP сервер для работы с документами различных форматов: PDF, CSV, TXT, XLSX, JSON, DOCX.

Требования

  • Python >= 3.10
  • uv (рекомендуется) или pip

Установка и запуск

Быстрый запуск

# Простой запуск с автоустановкой зависимостей
python run.py

С использованием uv (рекомендуется)

# Установка uv (если не установлен)
curl -LsSf https://astral.sh/uv/install.sh | sh

# Простой запуск - uv автоматически установит зависимости из pyproject.toml
uv run main.py

С использованием pip

# Создание виртуального окружения
python -m venv venv
source venv/bin/activate  # Linux/Mac
# или
venv\Scripts\activate     # Windows

# Установка зависимостей
pip install -r requirements.txt

# Запуск
python main.py

Установка как пакет

# С uv
uv pip install .

# С pip
pip install .

Поддерживаемые форматы и функции

PDF

  • get_pdf_pages_info - получение списка страниц с названиями
  • extract_pdf_text - извлечение текста по страницам
  • search_pdf_text - поиск текста в PDF

CSV

  • read_csv_file - чтение всего CSV файла
  • get_csv_columns - получение определенных столбцов
  • get_csv_rows - получение строк по диапазону
  • search_csv_content - поиск в CSV

TXT

  • read_txt_file - чтение файла по строкам с диапазоном
  • search_txt_content - поиск в текстовом файле

XLSX

  • get_xlsx_sheets_info - информация о листах
  • read_xlsx_sheet - чтение данных из листа
  • get_xlsx_cell_value - получение значения ячейки
  • search_xlsx_content - поиск в Excel файле

JSON

  • parse_json_file - парсинг структуры и значений
  • get_json_value - получение значения по пути
  • search_json_keys - поиск ключей

DOCX

  • get_docx_structure - получение структуры документа
  • extract_docx_text - извлечение текста
  • search_docx_content - поиск в документе

Универсальные инструменты

  • get_file_info - получение метаданных файла
  • get_file_summary - краткая сводка содержимого
  • search_in_file - универсальный поиск (автоопределение формата)
  • search_in_directory - поиск по всем файлам в папке

Структура проекта

├── main.py              # Основной MCP сервер
├── pyproject.toml     # Зависимости
├── tools/              # Модули инструментов
│   ├── __init__.py
│   ├── utils.py        # Общие утилиты
│   ├── pdf_tools.py    # Инструменты для PDF
│   ├── csv_tools.py    # Инструменты для CSV
│   ├── txt_tools.py    # Инструменты для TXT
│   ├── xlsx_tools.py   # Инструменты для XLSX
│   ├── json_tools.py   # Инструменты для JSON
│   ├── docs_tools.py   # Инструменты для DOCX
│   └── search_tools.py # Универсальный поиск

Все инструменты поддерживают как абсолютные, так и относительные пути к файлам.

Использование с MCP клиентами

После запуска сервер будет доступен для подключения MCP клиентов. Все инструменты автоматически регистрируются и готовы к использованию.

Примеры команд:

  • get_file_info("test_files/test.json") - получить метаданные файла
  • parse_json_file("test_files/test.json") - парсинг JSON
  • read_txt_file("test_files/test.txt", 1, 3) - чтение строк 1-3
  • search_in_file("test_files/test.csv", "Москва") - поиск в файле
Quick Setup
Installation guide for this server

Install Package (if required)

uvx mcp-documents-work

Cursor configuration (mcp.json)

{ "mcpServers": { "thebatashev-mcp-documents-work": { "command": "uvx", "args": [ "mcp-documents-work" ] } } }
Author Servers
Other servers by TheBatashev