Metadata-Version: 2.1
Name: mongol_register_parser
Version: 0.1.0
Summary: mongol register parser
Home-page: https://github.com/ganbaaelmer/mongol_register_parser.git
Author: Ganbaatar Bold
Author-email: elmerganbaa <elmerganbaa@gmail.com>
Project-URL: Homepage, https://github.com/ganbaaelmer/mongol_register_parser
Project-URL: Issues, https://github.com/ganbaaelmer/mongol_register_parser
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.6
Description-Content-Type: text/markdown
License-File: LICENSE

# v0.1.0

## Суулгах:

https://pypi.org/project/mongol-register-parser/

https://github.com/ganbaaelmer/mongol_register_parser

эсвэл

```

pip install mongol-register-parser

```

## Ашиглах заавар:

### -option1: .csv файлаас регистерийн тугаарын мэдээллийг задлах:

```

from mongol_register_parser import mongol_register_parser


fileName ='your_file_name.csv'

register_number_column = "register_number_column_name"

df = mongol_register_parser.mongol_register_parser(your_csv_file_name, register_number_column_name)

```

#### үр дүн:

df дотор age, birthYearColumn,birthMonthColumn,birthDayColumn, birthColumn, ageColumn, genderExtractedColumn  гэсэн баганууд үүснэ.

age_added.csv гэсэн файл дискэн дээр хадгалагдана.



### -option2: 1ш регистрийн тугаарын мэдээллийг задлах:

```

birthplace, birthYear,birthMonth,birthDay, birthdate, age, gender = mongol_register_parser.single_register_parser(text)

```


#### үр дүн:

birthplace, birthYear,birthMonth,birthDay, birthdate, age, gender утгууд буцаана.

## Тайлбар:

Монгол регистрийн дугаарын эхний 2 орон буюу үсэг нь регистрийн дугаар авч байгаа иргэний байнга 
оршин суудаг аймаг /дүүрэг/, сум /хороо/-ны код, дараагийн 6 орон нь төрсөн он, сар, өдөр 9 дэх орон нь хүйс, 
сүүлийн нэг орон нь хяналтын код байна.

Регистрийн эхний 2 тоон орон нь тухайн иргэний төрсөн оны сүүлийн 2 тоог тэмдэглэдэг. 
Түүний дараагийн 2 орон төрсөн сарыг илэрхийлэх бөгөөд 2000 он болон түүнээс хойш төрсөн хүмүүсийн
хувьд төрсөн сар дээр нь 20-ийг нэмж тэмдэглэдэг. Харин дараагийн 2 орон төрсөн өдрийг илэрхийлнэ.

Регистрийн дугаарын сүүлээсээ 2 дахь тоо нь хүйсийг заах бөгөөд хэрвээ тус тоо сондгой бол хүйс нь эрэгтэй,
үгүй бол эмэгтэй гэж үзнэ. Харин хамгийн сүүлийн орон бол, тус регистрийн дугаарыг үнэн оруулсан эсэхийг шалгахад
ашиглагддаг тоо болно. Хэрхэн уг тоог ашиглан шалгаж болох талаар нээлттэй эх сурвалжуудад баттай мэдээлэл байхгүй ч,
энэхүү нийтлэлийн коммент хэсэгт уг тоо регистрийн дугаарт орж байгаа үсэг болон тоонуудын нийлбэрийг тодорхой нэг
тоонд хуваасны үлдэгдэлтэй тэнцэх ёстой гэх мэдээлэл байна.

## Анхаарах зүйлс:

-Уг parser нь 1930-с 1940 онд хүртэлх төрсөн хүмүүсийг Регистрийн дугаарыг бододгүй.

-Хэрэв буруу Регистрийн дугаар орж ирвэл 1000 - 1200 оны 01 сарын 01 гэж хадгалдаг тул анхаарна уу.
