[자바스크립트] 한글의 초성, 중성, 종성 분리하기

2013-04-07
21세기소년, 스터디

예전에 objective-C에서 유니코드 한글의 초,중,종성을 구하는 코드를 만든 적이 있는데, 자바스크립트에서는 String 객체의 charCodeAt() , fromCharCode()라는 두 개 함수를 가지고 유니코드 문자의 코드 값을 구하거나 그 반대의 동작을 할 수 있는 걸 발견하고, 자바 스크립트 버전으로 만들어 보았다.

	/**
	초성 중성 종성 분리 하기

	유니코드 한글은 0xAC00 으로부터
	초성 19개, 중상21개, 종성28개로 이루어지고
	이들을 조합한 11,172개의 문자를 갖는다.

	한글코드의 값 = ((초성 * 21) + 중성) * 28 + 종성 + 0xAC00
	(0xAC00은 'ㄱ'의 코드값)

	따라서 다음과 같은 계산 식이 구해진다.
	유니코드 한글 문자 코드 값이 X일 때,

	초성 = ((X – 0xAC00) / 28) / 21
	중성 = ((X – 0xAC00) / 28) % 21
	종성 = (X – 0xAC00) % 28

	이 때 초성, 중성, 종성의 값은 각 소리 글자의 코드값이 아니라
	이들이 각각 몇 번째 문자인가를 나타내기 때문에 다음과 같이 다시 처리한다.

	초성문자코드 = 초성 + 0x1100 //('ㄱ')
	중성문자코드 = 중성 + 0x1161 // ('ㅏ')
	종성문자코드 = 종성 + 0x11A8 – 1 // (종성이 없는 경우가 있으므로 1을 뺌)

	**/


	function iSound(a)
	{
	var r = ((a.charCodeAt(0) – parseInt('0xac00',16)) /28) / 21;
	var t = String.fromCharCode(r + parseInt('0x1100',16));
	return t;
	}

	function mSound(a)
	{
	var r = ((a.charCodeAt(0)- parseInt('0xac00',16)) / 28) % 21;
	var t = String.fromCharCode(r + parseInt('0x1161',16));
	return t;
	}

	function tSound(a)
	{
	var r = (a.charCodeAt(0) – parseInt('0xac00',16)) % 28;
	var t = String.fromCharCode(r + parseInt('0x11A8') -1);
	return t;
	}

view raw

hangulSound.js

hosted with ❤ by GitHub

관련

태그:javascript 한글 음소분리 한글 초성