-
Notifications
You must be signed in to change notification settings - Fork 1
/
merger.py
70 lines (53 loc) · 3.06 KB
/
merger.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
# -*- coding: utf-8 -*-
"""
Created on Mon Apr 9 19:21:38 2018
@author: Bulat
"""
import pandas as pd
import os
fl = os.listdir('tables/')
columns = ['Число избирателей, включенных в список избирателей'
,'Число избирательных бюллетеней, полученных участковой избирательной комиссией'
,'Число избирательных бюллетеней, выданных избирателям, проголосовавшим досрочно'
,'Число избирательных бюллетеней, выданных в помещении для голосования в день голосования'
,'Число избирательных бюллетеней, выданных вне помещения для голосования в день голосования'
,'Число погашенных избирательных бюллетеней'
,'Число избирательных бюллетеней в переносных ящиках для голосования'
,'Число бюллетеней в стационарных ящиках для голосования'
,'Число недействительных избирательных бюллетеней'
,'Число действительных избирательных бюллетеней'
,'Число утраченных избирательных бюллетеней'
,'Число избирательных бюллетеней, не учтенных при получении '
,'Бабурин Сергей Николаевич'
,'Грудинин Павел Николаевич'
,'Жириновский Владимир Вольфович'
,'Путин Владимир Владимирович'
,'Собчак Ксения Анатольевна'
,'Сурайкин Максим Александрович'
,'Титов Борис Юрьевич'
,'Явлинский Григорий Алексеевич']
from stat import S_ISREG, ST_CTIME, ST_MODE,ST_MTIME
import os, sys, time
# path to the directory (relative or absolute)
dirpath = r'tables'
# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)
# leave only regular files, insert creation date
entries = ((stat[ST_MTIME], path[7:])
for stat, path in entries if S_ISREG(stat[ST_MODE]))
z = list(entries)
z.sort(key=lambda x:x[0])
z1 = list(map(lambda x: "_".join(x[1].split("_")[:2]),z))
import pandas as pd
z1 = pd.DataFrame(z1).drop_duplicates()
def add_region():
total = pd.DataFrame(columns=columns)
fl = fl[1:]
for file in fl:
ff = open('tables/'+file,'rb')
o = pd.read_csv(ff,encoding='utf8')
o = o.T
o.columns= columns
total = pd.concat((total,o))
for file in files: