早教吧 育儿知识 作业答案 考试题库 百科 知识分享

java处理text文本求助,急,急,急.我有一个text文件,格式如下:汉字部分一asmuchaspossi-ble,tobebackwardcompati-blewithexistingwebbrowse-rs汉字部分二Thefollowingty-pographicalconventionsareusedinthisbook汉

题目详情
java 处理text文本求助,急,急,急.
我有一个text文件,格式如下:
汉字部分一 as much as possi-
ble,to be backward compati-
ble with existing webbrowse-
rs
汉字部分二 The following ty-
pographical conventions are
used in this book
汉字部分三 I have something
very similar in Midas 2.0
汉字部分四 I don’t much ca-
re about the parameter or t-
ag names
汉字部分五 It would be nice
if there was a way to spec-
ify the content type
...
需要写一段java文本处理代码,处理后原先的文本格式变为:
汉字部分一>> as much as possible,to be backward compatible with existing webbrowsers
汉字部分二>> The following typographical conventions are used in this book
汉字部分三>> I have something very similar in Midas 2.0
汉字部分四>> I don’t much care about the parameter or tag names
汉字部分五>> It would be nice if there was a way to specify the content type
...
也就是需要把汉字部分和英文用">>"隔开,同时使得英语部分处于一行.
由于text文件内容多,无法一一手工整理,
▼优质解答
答案和解析
提供一个思路吧:
通过Reader(使用BufferedReader类好了)读取文件,每次读取一行,每一行返回的是一个String.
对每一个String遍历他的每一个字符,使用 正则表达式验证中文字符(中文的编码范围是:\u4e00-\u9fa5 ).
从中文到英文表示需要添加”>>“,中英文到中文表示需要换行.
按照这些规则写入一个新的文件就可以了.