码迷,mamicode.com
首页 > 编程语言 > 详细

hdu 2030 汉字统计 (java)

时间:2015-05-25 10:13:08      阅读:113      评论:0      收藏:0      [点我收藏+]

标签:java   acm   中文处理   

问题:

java判断中文比较复杂。


汉字统计

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 29746    Accepted Submission(s): 16314


Problem Description
统计给定文本文件中汉字的个数。
 

Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
 

Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。

[Hint:]从汉字机内码的特点考虑~

 

Sample Input
2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready?
 

Sample Output
14 9


代码:

import java.util.*;

public class Main{
	public static void main(String args[]){
		Scanner cin=new Scanner(System.in);
		int n=cin.nextInt();		
		String s;
		cin.nextLine();
		for(int i=0;i<n;i++){
			s=cin.nextLine();
			char[] a=s.toCharArray();
			int count=0;
			for(int j=0;j<s.length();j++){
				Character.UnicodeBlock ub = Character.UnicodeBlock.of(a[j]);
				if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS

						|| ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS

						|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A

						|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION

						|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION

						|| ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS)
					count++;						
			}
			System.out.println(count);
		}
	}
}


hdu 2030 汉字统计 (java)

标签:java   acm   中文处理   

原文地址:http://blog.csdn.net/amx50b/article/details/45954607

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!