Metadata-Version: 2.1
Name: parse-hh-data
Version: 0.1.8
Summary: Package for parsing data (vacancies and resumes) from site hh.ru
Home-page: https://github.com/arinaaageeva/parse_hh_data
Author: Arina Ageeva
Author-email: arina.a.ageeva@gmail.com
License: UNKNOWN
Platform: UNKNOWN
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.6
Description-Content-Type: text/markdown
Requires-Dist: beautifulsoup4 (==4.8.2)
Requires-Dist: random-user-agent (==1.0.1)
Requires-Dist: requests (==2.23.0)
Requires-Dist: tqdm (==4.44.1)
Requires-Dist: urllib3 (==1.25.8)

# Parse HH Data Project

Данный модуль предназначен для удобного скачивания вакансий и резюме с сайта `hh.ru`

```python
from parse_hh_data import download, parse

vacancy = download.vacancy("36070814")

resume = download.resume("d40ce6f80001a8c8380039ed1f5874726f5a6e")
resume = parse.resume(resume)
```

**Вакансии** скачиваются с помощью [API HH](https://dev.hh.ru/) и возвращаются в формате описанном 
[здесь](https://github.com/hhru/api/blob/master/docs/vacancies.md#%D0%BF%D1%80%D0%BE%D1%81%D0%BC%D0%BE%D1%82%D1%80-%D0%B2%D0%B0%D0%BA%D0%B0%D0%BD%D1%81%D0%B8%D0%B8).

Обезличенные **резюме** скачиваются непосредственно с [сайта](https://hh.ru/search/resume) в html-формате, 
а затем могут быть преобразованны в json-формат:

    gender : str - пол соискателя
    birthday : str - дата рождения
    address : str - город проживания
    name : str - название резюме
    salary : str or None - желаемая зарплата 
    description : str - дополнительная информация, описание навыков в свободной форме (может содержать html-код)
    key_skills : list - список ключевых навыков
            name : str - название ключевого навыка
    experiences : list - опыт работы
            start : str - начало работы (дата в формате dd-MM-yyyy)
            end : str - окончание работы (дата в формате dd-MM-yyyy)
            position : str - должность
            description : str - обязанности, функции, достижения (может содержать html-код)

с помощью `parse_hh_data.parse.resume`.

Скачать списки идентификаторов вакансий или резюме можно используя 
`parse_hh_data.download.vacancy_ids` или `parse_hh_data.download.resume_ids`, соответсвенно.

### Command line interface

`python download.py ~/resumes resume --area_ids 113 --specialization_ids 1 --search_period 30`

`parse_resumes ~/data/resumes ~/data/resumes_json`

