import os
import numpy as np
import pandas as pd
from dateutil.parser import parse
import sys
path = '/Users/austin/Desktop/未命名 6.txt'
r = open(path)
text = r.readlines() # 项目
print(text)
list = []
for i in text:
if '到' not in i:
print('程序停止') #如果缺少“到“直接停止
sys.exit(0)
if '点' in i:
i = i.replace('点',':00') #把点替换成:00
mytime = i.split('到')[1]
mytime = parse(mytime.split('\n')[0]) #把时间转换成datetime
list.append(mytime)
s = pd.Series(list)
s[len(s)] = 0 #加一行 抵充shift的副作用
s = s.shift(1)
s[0] = pd.Timestamp(str(s[1])[:11] + '00:00:00') #增加起始00:00:00
timespace = []
for i in range(len(s)-1):
timespace.append(s[i+1]-s[i]) #获得差值
# print(timespace)
timeuse = []
for i in timespace:
p = str(i).split(' ')[-1] #转换成str格式
if p.startswith('+'):
p = str(int(p[1:3])-12) + p[3:] #处理掉中午12点到下午1点的突变
print(p)
timeuse.append(p)
print(timeuse)
#整理成表格
data1 = {'name':text, 'timeuse':timeuse}
frame = pd.DataFrame(data1)
frame['name'] = frame['name'].str[:-1]
print(frame)
数据在这里 放在text纯文本里
到0:00
睡觉到7:09
杂事到7:21
看书到8:33
杂事到9:10
听音频到10:20
杂事到10:33
看视频到10:54
看编程到12:18
吃饭到12:37
学习编程到1:53
杂事到5:00
弄金融数据包到7:50
学习数据分析到8:29
杂事到8:44
学习gis到9:14
看老唐文章到9:20
整理到9:26
回家到10:20
弄编程到12点
import os
import numpy as np
import pandas as pd
from dateutil.parser import parse
import sys
path = '/Users/austin/Desktop/timeuse.txt'
r = open(path)
text = r.readlines() # 项目
list = []
for i in text:
if '到' not in i:
print('程序停止') #如果缺少“到“直接停止
sys.exit(0)
if '点' in i:
i = i.replace('点',':00') #把点替换成:00
mytime = i.split('到')[1]
mytime = parse(mytime.split('\n')[0]) #把时间转换成datetime
list.append(mytime)
s = pd.Series(list)
s[len(s)] = 0 #加一行 抵充shift的副作用
s = s.shift(1)
s[0] = pd.Timestamp(str(s[1])[:11] + '00:00:00') #增加起始00:00:00
timespace = []
for i in range(len(s)-1):
timespace.append(s[i+1]-s[i]) #获得差值
# print(timespace)
timeuse = []
for i in timespace:
p = str(i).split(' ')[-1] #转换成str格式
if p.startswith('+'):
p = str(int(p[1:3])-12) + p[3:] #处理掉中午12点到下午1点的突变
# print(p)
timeuse.append(p)
#整理成表格
data1 = {'name':text, 'timeuse':timeuse}
frame = pd.DataFrame(data1)
frame.loc[:len(frame)-2,'name'] = frame.loc[:len(frame)-2,'name'].str[:-1]
# frame[:-1]['name'] = frame[:-1]['name'].str[:-1]
# frame.loc[:-1]['name']
# frame.loc[:len(frame),'timeuse']
# frame.shape[0]
# len(frame)
frame
网友评论