hiczlf · July 28, 2020 02:22 · hiczlf · Jul 28, 2020
diff --git a/py b/py
 import pprint

 # 需要替换的文本
 s = """
 2020/7/28 9:03:01,姓名:科创,班级：Y1系_1班，年龄：15
 2020/7/28 9:03:01,姓名:新三,班级：Y2系_2班，年龄：16
 2020/7/28 9:03:01,姓名:创业,班级：Y3系_3班，年龄：17
 """

 # 命令后解析
 import argparse
 parser = argparse.ArgumentParser()
 parser.add_argument('file', help='要解析的txt文件路径')
 args = parser.parse_args()

 # 读取文件
 s = open(args.file, 'r').read()

 # 替换不标准字符为英文字符, 处理起来比较简单
 s = s.replace("，", ",")
 s = s.replace("：", ":")


 result = []
 for line in s.splitlines():
    row = line.split(',')
    item = {}
    if not row or len(row) == 1:
        continue

    # 下面几行的缩进被吃掉了
    item['姓名'] = row[1].split(':')[1]
    item['院系'] = row[2].split(':')[1].split('_')[0]
    item['班级'] = row[2].split(':')[1].split('_')[1]
    item['年龄'] = row[3].split(':')[1]
    result.append(item)

 pprint.pprint(result)
	import pprint

	# 需要替换的文本
	s = """
	2020/7/28 9:03:01,姓名:科创,班级：Y1系_1班，年龄：15
	2020/7/28 9:03:01,姓名:新三,班级：Y2系_2班，年龄：16
	2020/7/28 9:03:01,姓名:创业,班级：Y3系_3班，年龄：17
	"""

	# 命令后解析
	import argparse
	parser = argparse.ArgumentParser()
	parser.add_argument('file', help='要解析的txt文件路径')
	args = parser.parse_args()

	# 读取文件
	s = open(args.file, 'r').read()

	# 替换不标准字符为英文字符, 处理起来比较简单
	s = s.replace("，", ",")
	s = s.replace("：", ":")


	result = []
	for line in s.splitlines():
	row = line.split(',')
	item = {}
	if not row or len(row) == 1:
	continue

	# 下面几行的缩进被吃掉了
	item['姓名'] = row[1].split(':')[1]
	item['院系'] = row[2].split(':')[1].split('_')[0]
	item['班级'] = row[2].split(':')[1].split('_')[1]
	item['年龄'] = row[3].split(':')[1]
	result.append(item)

	pprint.pprint(result)