1 / 6

UTF (universal transformation format)

UTF (universal transformation format). UTF 는 16 비트 유니코드 문자들을 7 비트 혹은 8 비트 문자로 변환하기 위한 방법이다 . UTF -7 은 7 비트 메일 시스템을 통한 전송을 위해 7 비트 아스키 문자로 변경하는 것이고 , UTF -8 은 유니코드를 8 비트 문자로 변경하는 것이다 . 이 http://www.terms.co.kr/UTF.htm. text ; 텍스트.

fynn
Download Presentation

UTF (universal transformation format)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UTF (universal transformation format) UTF는 16 비트 유니코드 문자들을 7 비트 혹은 8 비트 문자로 변환하기 위한 방법이다. UTF-7은 7 비트 메일 시스템을 통한 전송을 위해 7 비트 아스키 문자로 변경하는 것이고, UTF-8은 유니코드를 8 비트 문자로 변경하는 것이다. 이http://www.terms.co.kr/UTF.htm

  2. text ; 텍스트 • 정보기술 측면에서, 텍스트란 인간이 읽을 수 있는 일련의 글자와, ASCII와 같이 컴퓨터가 읽을 수 있는 형식으로 바꿀 수 있는 단어들을 말한다. 텍스트는 보통 비트맵 형태의 그래픽 이미지나 흔히 바이너리라고 불리우는 프로그램 코드 등, 글자가 아닌 데이터와 구분하기 위해 사용되는 용어이다.

  3. Unicode ; 유니코드 • 유니코드는 텍스트나 스크립트 문자에 대한 바이너리 코드를 확립하기 위한 완전히 새로운 아이디어이다. 공식적으로는 "세계문자 표준 - 유니코드"라고 불리는 이 코드체계는 "세계 각국의 다양한 현대 언어로 작성된 텍스트에 대해 상호교환, 처리, 및 표현"을 용이하게 하기 위한 시스템이다. • 현재 유니코드 표준은 24개 언어를 지원하기 위해 34,168개의 개별 코드문자를 담고 있는데, 이 문자들은 세계 주요 언어로 작성된 문자들을 모두 충족시키기에 충분하며, 심지어 여러 가지 언어로 작성된 고문서(古文書)까지도 지원할 수 있다. • 현재 아직 포함되지 않은 몇 가지 현대 언어를 추가하기 위한 작업이 진행중이다. 유니코드 표준은 버전1.0 이며 다음의 사이트에서 구해볼 수 있다. 또한, 현재 가장 널리 퍼진 스크립트 및 텍스트 코드인 아스키와 엡시딕을 참조하기 바란다.

  4. ASCII (American Standard Code for Information Interchange) • 아스키는 컴퓨터나 인터넷상에서 텍스트 파일을 위한 가장 일반적인 형식이다. 아스키 파일에서는 각각의 알파벳이나 숫자 그리고 특수문자들이 7 비트의 2 진수 (7개의 0 또는 1의 조합으로 이루어진 스트링)로 표현되며, 총 128개의 문자가 정의되어 있다. • [참고] 아스키 문자셋을 나타낸 표를 참조하려면 여기를 누르시요. • 유닉스나 도스 기반의 운영체계(윈도우 NT는 제외)는 텍스트 파일을 표현하는데 있어 아스키를 사용한다. 윈도우 NT의 경우에는 유니코드라고 하는 새로운 코드를 사용하며, IBM의 System 390 서버들은 엡시딕이라고 부르는 자신들만의 고유한 8 비트 코드체계를 사용한다. 따라서 서로 다른 운영체계 간에 어떤 파일을 교환하기 위해서는 코드 변환 프로그램이 필요하게 된다. • 아스키는 미국규격협회인 ANSI에 의해 개발되었다.

  5. Hex Hex Name Name Description Description 00 10 DLE NUL Data Link Escape Null ^@ 11 01 XON SOH Xmit ON ^Q Start Of Heading 02 12 DC2 STX Device Control 2 Start of TeXt 03 13 XOFF ETX Xmit OFF ^S End of TeXt 04 14 DC4 EOT Device Control 4 End Of Transmission 05 15 NAK ENQ Negative AcKnowledge ENQuiry 06 16 SYN ACK SYNchronous idle ACKnowledge 07 17 ETB BEL End of Transmission Block BELl (beep) ^G 08 18 CAN BS CANcel BackSpace ^H 09 19 EM TAB End of Medium horizontal TAB ^I 0A 1A SUB LF SUBstitute Line Feed ^J 1B 0B ESC VT ESCape ^[ Vertical Tab 1C 0C FS FF File Separator Form Feed ^L 1D 0D GS CR Group Separator Carriage Return 0E 1E RS SO Record Separator Shift Out 1F 0F US SI Unit Separator Shift In

  6. binary MSN 0000 0001 0010 0011 0100 0101 0110 0111 LSN hex 0 1 2 3 4 5 6 7 0000 0 NUL 000 DLE 1610 SP 3220 0 4830 @ 6440 P 8050 ` 9660 p 11270 0001 1 SOH 101 XON(DC1) 1711 ! 3321 1 4931 A 6541 Q 8151 a 9761 q 11371 0010 2 STX 202 DC2 1812 " 3422 2 5032 B 6642 R 8252 b 9862 r 11472 0011 3 ETX 303 XOFF (DC2) 1913 # 3523 3 5133 C 6743 S 8353 c 9963 s 11573 0100 4 EOT 404 DC4 2014 $ 3624 4 5234 D 6844 T 8454 d 10064 t 11674 0101 5 ENQ 505 NAK 2115 % 3725 5 5335 E 6945 U 8555 e 10165 u 11775 0110 6 ACK 606 SYN 2216 & 38 26 6 5436 F 7046 V 8656 f 10266 v 11876 0111 7 BEL 707 ETB 2317 ' 3927 7 5537 G 7147 W 8757 g 10367 w 11977 1000 8 BS 808 CAN 2418 ( 4028 8 5638 H 7248 X 8858 h 10468 x 12078 1001 9 HT 909 EM 2519 ) 4129 9 5739 I 7349 Y 8959 i 10569 y 12179 1010 A LF 100A SUB 261A * 422A : 583A J 744A Z 905A j 1066A z 1227A 1011 B VT 110B ESC 271B + 432B ; 593B K 754B [ 915B k 1076B { 1237B 1100 C FF 120C FS 281C , 442C < 603C L 764C \ 925C l 1086C | 1247C 1101 D CR 130D GS 291D - 452D = 613D M 774D ] 935D m 1096D } 1257D 1110 E SO 140E RS 301E . 462E > 623E N 784E ^ 94 5E n 1106E ~ 1267E 1111 F SI 150F US 311F / 272F ? 633F O 794F _ 955F o 1116F DEL 1277F

More Related