M
MCP Documents Work
by @TheBatashev
MCP server by TheBatashev
Created 8/1/2025
Updated 5 months ago
README
Repository documentation and setup instructions
MCP Document Tools
MCP сервер для работы с документами различных форматов: PDF, CSV, TXT, XLSX, JSON, DOCX.
Требования
- Python >= 3.10
- uv (рекомендуется) или pip
Установка и запуск
Быстрый запуск
# Простой запуск с автоустановкой зависимостей
python run.py
С использованием uv (рекомендуется)
# Установка uv (если не установлен)
curl -LsSf https://astral.sh/uv/install.sh | sh
# Простой запуск - uv автоматически установит зависимости из pyproject.toml
uv run main.py
С использованием pip
# Создание виртуального окружения
python -m venv venv
source venv/bin/activate # Linux/Mac
# или
venv\Scripts\activate # Windows
# Установка зависимостей
pip install -r requirements.txt
# Запуск
python main.py
Установка как пакет
# С uv
uv pip install .
# С pip
pip install .
Поддерживаемые форматы и функции
get_pdf_pages_info- получение списка страниц с названиямиextract_pdf_text- извлечение текста по страницамsearch_pdf_text- поиск текста в PDF
CSV
read_csv_file- чтение всего CSV файлаget_csv_columns- получение определенных столбцовget_csv_rows- получение строк по диапазонуsearch_csv_content- поиск в CSV
TXT
read_txt_file- чтение файла по строкам с диапазономsearch_txt_content- поиск в текстовом файле
XLSX
get_xlsx_sheets_info- информация о листахread_xlsx_sheet- чтение данных из листаget_xlsx_cell_value- получение значения ячейкиsearch_xlsx_content- поиск в Excel файле
JSON
parse_json_file- парсинг структуры и значенийget_json_value- получение значения по путиsearch_json_keys- поиск ключей
DOCX
get_docx_structure- получение структуры документаextract_docx_text- извлечение текстаsearch_docx_content- поиск в документе
Универсальные инструменты
get_file_info- получение метаданных файлаget_file_summary- краткая сводка содержимогоsearch_in_file- универсальный поиск (автоопределение формата)search_in_directory- поиск по всем файлам в папке
Структура проекта
├── main.py # Основной MCP сервер
├── pyproject.toml # Зависимости
├── tools/ # Модули инструментов
│ ├── __init__.py
│ ├── utils.py # Общие утилиты
│ ├── pdf_tools.py # Инструменты для PDF
│ ├── csv_tools.py # Инструменты для CSV
│ ├── txt_tools.py # Инструменты для TXT
│ ├── xlsx_tools.py # Инструменты для XLSX
│ ├── json_tools.py # Инструменты для JSON
│ ├── docs_tools.py # Инструменты для DOCX
│ └── search_tools.py # Универсальный поиск
Все инструменты поддерживают как абсолютные, так и относительные пути к файлам.
Использование с MCP клиентами
После запуска сервер будет доступен для подключения MCP клиентов. Все инструменты автоматически регистрируются и готовы к использованию.
Примеры команд:
get_file_info("test_files/test.json")- получить метаданные файлаparse_json_file("test_files/test.json")- парсинг JSONread_txt_file("test_files/test.txt", 1, 3)- чтение строк 1-3search_in_file("test_files/test.csv", "Москва")- поиск в файле
Quick Setup
Installation guide for this server
Install Package (if required)
uvx mcp-documents-work
Cursor configuration (mcp.json)
{
"mcpServers": {
"thebatashev-mcp-documents-work": {
"command": "uvx",
"args": [
"mcp-documents-work"
]
}
}
}
Author Servers
Other servers by TheBatashev