首先,定义两个存储统计结果的列表:
rawCountInfo=[0,0,0,0,0]
detailCountInfo=[]
其中,rawCountInfo存储粗略的文件总行数信息,列表元素依次为文件行、代码行、注释行和空白行的总数,以及文件数目。detailCountInfo存储详细的统计信息,包括单个文件的行数信息和文件名,以及所有文件的行数总和。这是一个多维列表,存储内容示例如下:
[['line.c',[33,19,15,4]],['test.c',[44,34,3,7]]]
以下将给出具体的实现代码。为避免大段粘贴代码,以函数为片段简要描述。
defCalcLines(lineList):
lineNo,totalLines=0,len(lineList)
codeLines,commentLines,emptyLines=0,0,0
whilelineNo iflineList[lineNo].isspace():#空行 emptyLines+=1;lineNo+=1;continue regMatch=re.match('^([^/]*)/(/|*)+(.*)$',lineList[lineNo].strip()) ifregMatch!=None:#注释行 commentLines+=1 #代码&注释混合行 ifregMatch.group(1)!='': codeLines+=1 elifregMatch.group(2)=='*' andre.match('^.**/.+$',regMatch.group(3))!=None: codeLines+=1 #行注释或单行块注释 if'/*'notinlineList[lineNo]or'*/'inlineList[lineNo]: lineNo+=1;continue #跨行块注释 lineNo+=1 while'*/'notinlineList[lineNo]: iflineList[lineNo].isspace(): emptyLines+=1 else: commentLines+=1 lineNo=lineNo+1;continue commentLines+=1#'*/'所在行 else:#代码行 codeLines+=1 lineNo+=1;continue return[totalLines,codeLines,commentLines,emptyLines] CalcLines()函数基于C语法判断文件行属性,按代码、注释或空行分别统计。参数lineList由readlines()读取文件得到,读到的每行末尾均含换行符。strip()可剔除字符串首尾的空白字符(包括换行符)。当通过print输出文件行内容时,可采用如下两种写法剔除多余的换行符: print'%s'%(line),#注意行末逗号 print'%s'%(line.strip()) 行尾包含换行符的问题也存在于readline()和read()调用,包括forlineinfile的语法。对于read()调用,可在读取文件后split('')得到不带换行符的行列表。注意,调用readlines()和read()时,会读入整个文件,文件位置指示器将指向文件尾端。此后再调用时,必须先通过file.seek(0)方法返回文件开头,否则读取的内容为空。 defCountFileLines(filePath,isRaw=True): fileExt=os.path.splitext(filePath) iffileExt[1]!='.c'andfileExt[1]!='.h':#识别C文件 return try: fileObj=open(filePath,'r') exceptIOError: print'Cannotopenfile(%s)forreading!',filePath else: lineList=fileObj.readlines() fileObj.close() ifisRaw: globalrawCountInfo rawCountInfo[:-1]=[x+yforx,yinzip(rawCountInfo[:-1],CalcLines(lineList))] rawCountInfo[-1]+=1 else: detailCountInfo.append([filePath,CalcLines(lineList)]) CountFileLines()统计单个文件的行数信息,其参数isRaw指示统计报告是粗略还是详细的。对于详细报告,需要向detailCountInfo不断附加单个文件的统计结果;而对于详细报告,只需要保证rawCountInfo的元素值正确累加即可。 defReportCounterInfo(isRaw=True): #Python2.5版本引入条件表达式(if-else)实现三目运算符,低版本可采用and-or的短路特性 #print'FileLinesCodeLinesCommentLinesEmptyLines%s'%(''ifisRawelse'FileName') print'FileLinesCodeLinesCommentLinesEmptyLines%s'%(notisRawand'FileName'or'') ifisRaw: print'%-11d%-11d%-14d%-12d'%(rawCountInfo[0],rawCountInfo[1], rawCountInfo[2],rawCountInfo[3],rawCountInfo[4]) return total=[0,0,0,0] #对detailCountInfo按第一列元素(文件名)排序,以提高输出可读性 #importoperator;detailCountInfo.sort(key=operator.itemgetter(0)) detailCountInfo.sort(key=lambdax:x[0])#简洁灵活,但不如operator高效 foritemindetailCountInfo: print'%-11d%-11d%-14d%-12d%s'%(item[1][0],item[1][1],item[1][2],item[1][3],item[0]) total[0]+=item[1][0];total[1]+=item[1][1] total[2]+=item[1][2];total[3]+=item[1][3] print'%-11d%-11d%-14d%-12d'%(total[0],total[1],total[2],total[3],len(detailCountInfo)) ReportCounterInfo()输出统计报告。注意,详细报告输出前,先按文件名排序。 defCountDirLines(dirPath,isRawReport=True): ifnotos.path.exists(dirPath): printdirPath+'isnon-existent!' return ifnotos.path.isdir(dirPath): printdirPath+'isnotadirectory!' return forroot,dirs,filesinos.walk(dirPath): forfileinfiles: CountFileLines(os.path.join(root,file),isRawReport) ReportCounterInfo(isRawReport) CountDirLines()统计当前目录及其子目录下所有文件的行数信息,并输出统计报告。注意,os.walk()不一定按字母顺序遍历文件。在作者的WindowsXP主机上,os.walk()按文件名顺序遍历;而在LinuxRedhat主机上,os.walk()以"乱序"遍历。 最后,添加简单的命令行处理: if__name__=='__main__': DIR_PATH=r'E:PyTestlctest' iflen(sys.argv)==1:#脚本名 CountDirLines(DIR_PATH) sys.exit() iflen(sys.argv)>=2: ifint(sys.argv[1]): CountDirLines(DIR_PATH,False) else: CountDirLines(DIR_PATH) sys.exit() 以上内容为大家介绍了PythonC代码统计工具的代码实现,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注IT培训机构:千锋教育。