컴퓨터가 우리 나라에 도입된 이래 점차 대중화되면서 컴퓨터에서의 한글 처리 문제가 중요한 과제로 등장하게 되었다. 초기에는 외국의 기술에 의존할 수밖에 없었지만 기술이 축적되면서 한글 전산화는 비약적으로 발전했으며, 일상에서의 문자 생활을 감당하기에 충분한 정도가 되었다.
1바이트로 처리될 수 있는 영문자와는 달리 한글(음절)은 글자의 특성상 2바이트 이상의 부호 체계로 구성되는데, 이를 국가 표준화한 것이 KSC 5601이다. 국제표준화기구의 정보 교환용 부호 체계인 ISO 2022에 맞추어 1987년 처음 제정된 이 표준은 ‘완성형 한글 코드’로 불리며, 사용 빈도가 높은 한글 2,350자와 한자 4,888자 및 특수 문자 986자로 구성되어 있다.
이 체계는 제정 이후 행정 전산망 등에서 사용되었고, <윈도 95> 등 개인용 컴퓨터 운영 체계의 코드로도 사용될 정도로 힘을 가지게 되었다. 그러나 완성형 한글은 모든 한글 글자를 전부 지원하지는 못하며, 그 구성 방법도 한글 음절의 조합 원리에 맞지 않기 때문에, 민간에서 사용되던 코드 체계를 발전시켜 1992년 소위 ‘조합형 한글 코드’를 복수 표준화하였다.
조합형은 초성·중성·종성자들에 일정한 값(5비트로 정해짐)을 정해 두고, 여기에 한글 구분 비트를 보태어, 그 값들을 조합한 2바이트 값을 코드값으로 가진다. 이 부호계는 일부 문서처리기(워드프로세서)에서 내부 정보 처리 부호계로 사용되고 있다.
한편 세계 각국의 모든 문자를 한 체계 안에서 사용하기 위한 연구가 계속되어 ISO 10646-1이라는 국제표준부호계가 마련되었고, 우리 나라에서도 1995년 이를 국내표준(KS C 5700)으로 받아들였다.
이 부호계에서 한글 음절자 11,172자는 완성형으로 처리되며, 한글 옛 글자를 포함한 자소도 들어 있기 때문에 조합의 과정을 거쳐 거의 모든 한글 음절자를 구현할 수 있다. 이외에도 우리 문헌에 등장하는 구결자도 처리할 수 있으며, 한자도 2만여 자까지 쓸 수 있다. 장차 이 부호계는 컴퓨터 사용 환경에 등장하여 정보 처리나 정보 교환 등에서 편리하게 사용될 것으로 예상된다.
국가 표준으로써는 학술적인 용도로 사용하기에 충분하지 않기 때문에 민간에서 정보처리용으로 만들어 사용하는 부호계도 있다. (주)한글과컴퓨터사의 문서 처리기인 <글>의 부호계가 그 대표적인 것이다.
이 부호계는 KSC 5601-1992 조합형 체계를 기반으로 하여, 여기에 ISO 10646-1의 확장 기호를 비롯하여 한글 옛 글자와 소위 ‘확장 한자’ 10,880자까지 포함하고 있다. <글>은 문서 처리용으로만이 아니라 우리 문헌 자료의 입력 및 처리용으로도 사용되고 있다. 한국정신문화연구원의 ≪17세기 국어사전≫은 바로 이 체계로 입력 처리되고 출판까지 이루어졌다.
통일을 대비하여 ≪국어대사전≫을 편찬하고 있는 국립국어연구원에서는 이와는 별도로 모든 글자를 4바이트 체계로 처리하는 시스템을 개발하여 사전 편찬용으로 활용하고 있다.
컴퓨터에서 문자 자료를 처리하는 데 첫 관문이 되는 한글 입력은 흔히 자판을 통해 이루어진다. 자판은 타자기 시대부터 사용되던 것으로, 컴퓨터 자판의 구성은 그에 적합한 한글 입력용 프로그램과 결부되어 있다. 국가 표준은 KS C 5715로 규정되어 있으며, 그 특징은 영문 자판과 혼용하여 사용된다는 것, 2벌식으로 입력한다는 것 등이다.
컴퓨터의 한글 운영 체계나 한글 응용 프로그램에서는 오토마타(automata)라 불리는 한글 입력 원리를 사용한다. 2벌식이란 자음 한 벌, 모음 한 벌의 글쇠만으로써 모든 한글 음절을 입력한다는 것으로, 글자를 구성하고 있는 자음과 모음을 초-중-종성의 순서대로 누르기만 하면 적절한 입력 오토마타가 음절 모아쓰기를 자동으로 실현한다. 예를 들어 ‘나랏님’을 입력하기 위해서는 ‘ㄴ-ㅏ-ㄹ-ㅏ-ㅅ-ㄴ-ㅣ-ㅁ’을 순서대로 입력하면 된다.
자판을 사용하지 않고 입력하는 방식으로는 문자 인식·음성 인식 방법도 연구되고 있으며, 문자 인식의 경우에는 상당한 성과를 거두어 이미 상업적인 프로그램도 나와 있다. 문자 인식은 이미 인쇄된(혹은 쓰여진) 글자를 인식하는 오프라인 인식과, 컴퓨터에 연결된 전자 펜으로 글자를 써 나가면 이를 인식하는 온라인 인식으로 나누어진다.
오프라인 인식은 인쇄된 글자에 활용되며, 그 인식율이 나날이 개선되어 최근에는 90% 이상의 높은 성과를 거두고 있다. 휴대용 컴퓨터를 위해 필기체 글자 온라인 인식이 개발되고 있으나, 아직 제약이 많다.
문서처리기(워드프로세서)는 개인용 컴퓨터에서 가장 많이 사용되는 프로그램이다. 따라서 컴퓨터의 보급과 함께 문서처리기도 보급되었지만, 초기에는 우리 나라에서 독자적으로 개발된 것이 없었고, 외국의 문서처리기(워드프로세서)를 수입하여 여기에 한글을 이식하여 처리하였다.
국내에서 개발된 것은 있었다 하더라도 아주 빈약한 수준이었다. 근래에는 독자적인 문서처리기가 개발되었을 뿐만 아니라 그 수준도 상당히 신장되어 우리 나라에서 사용되는 것은 물론이고 외국으로 수출도 하고 있다.
우리나라의 문서 환경은 외국과는 달리 여러 문자 체계가 포함되어있어야 하며, 도표의 형식이나 문장의 정렬 방식이 독특한 편이다. 이런 점에서 우리의 고유 문화와 접맥된 문서처리기의 개발이 과제로 남아 있다.
근래의 문서처리기는 문서 작성에 필요한 모든 기능을 두루 갖추는 방향으로 나아가고 있으며, 전문적인 수준의 출판 편집용으로도 거의 손색이 없을 정도로 발전하고 있다.
문서처리기에 맞춤법 검사기 및 한글 사전(일반 사전 및 유의어 사전), 한자 사전까지 포함되어 글 쓰기의 효율을 높여 줄 뿐더러 검색 기능과 재배열(sort) 기능까지 들어 있고, 매크로(macro)를 활용하면 한글 문헌 자료에 대한 갖가지 가공도 가능하다.
초기에는 명조체나 고딕체의 비트맵(bitmap) 글꼴이 고작이었으나, 최근에는 글꼴에 대한 저작권이 어느 정도 인정되고, 글꼴 제작 도구까지 보급되면서 전문 업체들이 새로운 글꼴을 보급하고 있다.
초기에는 비트맵 방식의 글꼴을 질이 낮은 인쇄기에서 느린 속도로 출력했지만, 지금은 일반적으로 해상도가 최소 300 dpi 이상인 레이저 프린터를 이용하여 윤곽선 글꼴을 자유자재로 출력하고 있다.
이에 따라 종래 주로 일본으로부터 수입되던 글꼴을 대체하게 되었으며, 일본 문자 글꼴을 수출하게도 되었다. 개발된 글꼴은 문서처리기와 함께 보급되고 있으며, 최근에는 특별히 고품위가 요구되지 않는 책이라면 대부분 개인용 컴퓨터를 이용하여 탁상출판을 하고 있다.
한편 문화관광부에서는 글꼴 개발의 원칙인 자형을 제정하고, 바탕체·돋움체·훈민정음체·필기체 등의 글꼴을 제작하여 일반에 무상으로 공급하고 있다.
컴퓨터는 본래 미국에서 개발되어 수입된 것이기 때문에 기본적인 하드웨어는 영어 처리용으로 되어 있다. 이러한 하드웨어에 소프트웨어가 실려 제 구실을 하게 되는데, <윈도 95> 등 최근의 운영체계들은 한글을 사용할 수 있는 환경을 제공하고 있다.
한글로 파일 이름을 정하는 것도 가능하고, 모든 사용자 인터페이스도 한글을 바탕으로 처리된다. 앞으로 한글 음성 인식 등과 연결되면 보다 편리하게 컴퓨터를 사용할 수 있을 것이다.
컴퓨터에서 한글을 바탕으로 한 언어 처리도 꾸준히 연구되고 있다. 컴퓨터가 한글 및 한국어를 이해할 수 있게 하려는 목표하에 형태소 분석·구문 분석·전자사전 제작 등을 자동 처리하는 방법이 연구되고 있다. 이러한 연구의 성과에 따라 최근에는 영-한, 일-한 자동 번역(기계 번역) 프로그램들이 개발되고 있다.