博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python对多个同格式文件的某列读取到另外一个文件
阅读量:5047 次
发布时间:2019-06-12

本文共 2116 字,大约阅读时间需要 7 分钟。

#!/usr/bin/python

# -*- coding: UTF-8 -*-
import os
import glob
import sys
import re
import datetime
# 设置编码
reload(sys)
sys.setdefaultencoding('utf8')

filePath="/home/rfdev/cbh"

#proj1 = "*appStat.log*"

# 默认是读取昨天的日志

today = (datetime.datetime.now()+datetime.timedelta(days=-1)).strftime("%Y%m%d")

todayDb = (datetime.datetime.now()+datetime.timedelta(days=-1)).strftime("%Y-%m-%d")

tomorrowDb = (datetime.datetime.now()).strftime("%Y-%m-%d")

if len(sys.argv) == 2:

today = re.sub("-","",sys.argv[1])
todayDb = sys.argv[1]
tomorrowDb = (datetime.datetime.strptime(todayDb,'%Y-%m-%d')+datetime.timedelta(days=1)).strftime("%Y-%m-%d")

with open(r"/home/rfdev/cbh/test11.txt.tmp",'w') as file_object:

file_object.truncate()
os.chdir(filePath)
logPattern = "*appStat.log." + todayDb
for logFile in glob.iglob(logPattern):
f = open(logFile,"r")
line=f.readline()
while line:
SplashActivity = line.find("pageName=SplashActivity")
PadFragment = line.find("pageName=PadFragment")
RegisterActivity = line.find("pageName=RegisterActivity")
try:
if SplashActivity>0:
SplashActivity_id=line.split("cuid=")[1].split()[0].replace("\x00","")
with open(r"/home/rfdev/cbh/test11.txt.tmp",'a') as file_object:
file_object.write("1,"+SplashActivity_id+"\n")
elif PadFragment>0:
if line.find("date")>0:
if line.find("userId=0")>0:
PadFragment_id=line.split("cuid=")[1].split()[0].replace("\x00","")
with open(r"/home/rfdev/cbh/test11.txt.tmp",'a') as file_object:
file_object.write("2,"+PadFragment_id+"\n")
elif RegisterActivity>0:
RegisterActivity_id=line.split("cuid=")[1].split()[0].replace("\x00","")
with open(r"/home/rfdev/cbh/test11.txt.tmp",'a') as file_object:
file_object.write("3,"+RegisterActivity_id+"\n")
except IndexError,e:
print e.message
print line
line=f.readline()

with open(r"/home/rfdev/cbh/test11_new.txt",'w') as file_object1:

file_object1.truncate()

f1=open('/home/rfdev/cbh/test11.txt.tmp','r')

lines=f1.readline()
while lines:
if len(lines)<500:
with open(r"/home/rfdev/cbh/test11_new.txt",'a') as file_object1:
file_object1.write(lines)
lines=f1.readline()

 

转载于:https://www.cnblogs.com/phoneber/p/8203555.html

你可能感兴趣的文章
浅谈tcp粘包问题
查看>>
UVA11524构造系数数组+高斯消元解异或方程组
查看>>
排序系列之——冒泡排序、插入排序、选择排序
查看>>
爬虫基础
查看>>
jquery.lazyload延迟加载图片第一屏问题
查看>>
OGRE 源码编译方法
查看>>
上周热点回顾(10.20-10.26)
查看>>
web.xml中listener、 filter、servlet 加载顺序及其详解
查看>>
前端chrome浏览器调试总结
查看>>
数据库连接
查看>>
delphi.指针.PChar
查看>>
Objective - C基础: 第四天 - 10.SEL类型的基本认识
查看>>
极客前端部分题目收集【索引】
查看>>
第四天 selenium的安装及使用
查看>>
关于js的设计模式(简单工厂模式,构造函数模式,原型模式,混合模式,动态模式)...
查看>>
KMPnext数组循环节理解 HDU1358
查看>>
android调试debug快捷键
查看>>
【读书笔记】《HTTP权威指南》:Web Hosting
查看>>
Inoodb 存储引擎
查看>>
数据结构之查找算法总结笔记
查看>>