Was ist URL-Kodierung und wie funktioniert sie?
URL-Codierung ist eine Möglichkeit, reservierte und Nicht-ASCII-Zeichen in URLs in ein Format zu übersetzen, das von allen Webbrowsern und Servern allgemein akzeptiert und verstanden wird. Es macht die URLs zuverlässiger und sicherer.
Was ist URL-Codierung oder Prozentcodierung?
URLs im World Wide Web dürfen nur alphanumerische ASCII-Zeichen und einige andere sichere Zeichen wie Bindestrich (-), Unterstrich (_), Tilde (~) und Punkt (.) enthalten.
Alphabete / Ziffern / "-" / "_" / "~" / "."
Jedes andere Zeichen außer der obigen Liste muss codiert werden.
Die URL-Codierung, auch als Prozentcodierung bezeichnet, ist eine Möglichkeit, reservierte, nicht druckbare oder Nicht-ASCII-Zeichen in URLs in ein sicheres Format zu codieren oder zu maskieren, das über das Internet übertragen werden kann. Es wird auch bei der Vorbereitung von Daten zum Senden von HTML-Formularen mit Inhaltstyp application/x-www-form-urlencoded verwendet.
ASCII-Zeichencodierungsreferenz
Die folgende Tabelle ist eine Referenz von ASCII-Zeichen zu ihrer entsprechenden URL-kodierten Form.
Die folgende Tabelle verwendet Regeln, die in RFC 3986 für die URL-Codierung definiert sind.
Dezimal | Charakter | URL-Codierung (UTF-8) |
---|---|---|
0 | NUL (Nullzeichen) | %00 |
1 | SOH (Anfang des Headers) | %01 |
2 | STX (Textanfang) | %02 |
3 | ETX (Ende des Textes) | %03 |
4 | EOT (Ende der Übertragung) | %04 |
5 | ENQ (Anfrage) | %05 |
6 | ACK (Bestätigung) | %06 |
7 | BEL (Glocke (Klingeln)) | %07 |
8 | BS (Rücktaste) | %08 |
9 | HT (horizontale Registerkarte) | %09 |
10 | LF (Zeilenvorschub) | %0A |
11 | VT (vertikale Registerkarte) | %0B |
12 | FF (Seitenvorschub) | %0C |
13 | CR (Wagenrücklauf) | %0D |
14 | SO (ausschalten) | %0E |
fünfzehn | SI (einschalten) | %0F |
16 | DLE (Datenlink-Escape) | %10 |
17 | DC1 (Gerätesteuerung 1) | %11 |
18 | DC2 (Gerätesteuerung 2) | %12 |
19 | DC3 (Gerätesteuerung 3) | %13 |
20 | DC4 (Gerätesteuerung 4) | %14 |
21 | NAK (negative Bestätigung) | %fünfzehn |
22 | SYN (synchronisieren) | %16 |
23 | ETB (Endübertragungsblock) | %17 |
24 | KANN (abbrechen) | %18 |
25 | EM (Ende des Mediums) | %19 |
26 | SUB (Ersatz) | %1A |
27 | ESC (Flucht) | %1B |
28 | FS (Dateitrennzeichen) | %1C |
29 | GS (Gruppentrenner) | %1D |
30 | RS (Datensatztrennzeichen) | %1E |
31 | US (Einheitentrennzeichen) | %1F |
32 | Raum | %20 |
33 | ! | %21 |
34 | " | %22 |
35 | # | %23 |
36 | $ | %24 |
37 | % | %25 |
38 | & | %26 |
39 | ' | %27 |
40 | ( | %28 |
41 | ) | %29 |
42 | * | %2A |
43 | + | %2B |
44 | , | %2C |
45 | - | %2D |
46 | . | %2E |
47 | / | %2F |
48 | 0 | %30 |
49 | 1 | %31 |
50 | 2 | %32 |
51 | 3 | %33 |
52 | 4 | %34 |
53 | 5 | %35 |
54 | 6 | %36 |
55 | 7 | %37 |
56 | 8 | %38 |
57 | 9 | %39 |
58 | : | %3A |
59 | ; | %3B |
60 | < | %3C |
61 | = | %3D |
62 | > | %3E |
63 | ? | %3F |
64 | @ | %40 |
65 | EIN | %41 |
66 | B | %42 |
67 | C | %43 |
68 | D | %44 |
69 | E | %45 |
70 | F | %46 |
71 | g | %47 |
72 | h | %48 |
73 | ich | %49 |
74 | J | %4A |
75 | K | %4B |
76 | L | %4C |
77 | m | %4D |
78 | n | %4E |
79 | Ö | %4F |
80 | P | %50 |
81 | Q | %51 |
82 | R | %52 |
83 | S | %53 |
84 | T | %54 |
85 | U | %55 |
86 | V | %56 |
87 | W | %57 |
88 | x | %58 |
89 | Ja | %59 |
90 | Z | %5A |
91 | [ | %5B |
92 | \ | %5C |
93 | ] | %5D |
94 | ^ | %5E |
95 | _ | %5F |
96 | ` | %60 |
97 | a | %61 |
98 | b | %62 |
99 | c | %63 |
100 | d | %64 |
101 | e | %65 |
102 | f | %66 |
103 | g | %67 |
104 | h | %68 |
105 | i | %69 |
106 | j | %6A |
107 | k | %6B |
108 | l | %6C |
109 | m | %6D |
110 | n | %6E |
111 | o | %6F |
112 | p | %70 |
113 | q | %71 |
114 | r | %72 |
115 | s | %73 |
116 | t | %74 |
117 | u | %75 |
118 | v | %76 |
119 | w | %77 |
120 | x | %78 |
121 | y | %79 |
122 | z | %7A |
123 | { | %7B |
124 | | | %7C |
125 | } | %7D |
126 | ~ | %7E |
127 | DEL(delete (rubout)) | %7F |