Informàtica


Darrera actualització: 23.10.2000
Si coneixeu cap pàgina web que pugui ésser d'interès,
si voleu fer cap suggerència, crítica
o adreçar-nos simplement alguna paraula constructiva,
poseu-vos en contacte amb: mrr@tinet.fut.es


Símbols romànics

Vocals amb accents aguts Vocals amb accents greus Vocals amb accents circumflexos Vocals amb accents perispòmens Consonants Símbols tipogràfics
á = á
Á=Á
é=é
É=É
í=í
Í=Í
ó=ó
Ó=Ó
ú=ú
Ú=Ú
ý=ý
Ý=Ý
à = à
À = À
è = è
È = È
ì = ì
Ì = Ì
ò = ò
Ò = Ò
ù = ù
Ù = Ù
&acirc = â
&Acirc = Â
&ecirc = ê
&Ecirc = Ê
&icirc = î
&Icirc = Î
&ocirc = ô
&Ocirc = Ô
&ucirc = û
&Ucirc = Û
ã = ã
ã = ã
õ = õ
õ = õ
ç = ç
Ç = Ç
l·l = l·l
ñ = ñ
Ñ = Ñ
' = '
’ = ’
" = "
¡ = ¡
! = !
&lt; = <
&gt; = >
&#191; = ¿
&#063; = ?
&#170; = ª
&#186; = º
&copy; = ©

Retorn a l'inici


Símbols germànics

Vocals amb trema D'altres vocals Consonants
&auml; = ä
&Auml;=Ä
&euml;=ë
&Euml;=Ë
&iuml;=ï
&Iuml;=Ï
&ouml;=ö
&Ouml;=Ö
&uuml;=ü
&Uuml;=Ü
&yuml;=ÿ
&#159;=Ÿ
&aelig = æ
&AElig = Æ
&aring; = å
&Aring; = Å
&#156; = œ
&#140; = Œ
&oslash = ø
&Oslash = Ø
&szlig; = ß
&thorn; = þ
&THORN; = Þ
&eth; = ð
&ETH; = Ð

Retorn a l'inici


D'altres símbols:


EL SET DE CARÀCTERS CODIFICATS HTML DE L'ASCII AMERICÀ

Aquest set consta d'un total de 128 signes o caràcters, que completen l'alfabet anglès amb els caràcters emprats a d'altres llengües europees i amb caràcters tipogràfics i d'edició (espai en blanc, espais durs no trencables, signes de puntuació etc.).

Per escriure d'aquesta manera un caràcter, cal cercar-ne primer el número a la taula que figura a baix. A continuació, cal anteposar al número del caràcter els símbols <&#> i tancar-lo amb un punt i coma <;>. Així, si volem escriure el signe d'exclamació inicial <¡>, haurem d'escriure:

&#161;

Com veieu, de vegades és possible escriure un símbol de dues maneres possibles:
Escrivint-lo segons aquest set de caràcters (que reprodueix l'ASCII americà) o segons la codificació SGML.

El mateix signe d'exclamació, que abans hem escrit

&#161;

també el podem escriure:

&iexcl;

Taula de la a Norma ISO 8859-1

  0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
020                           ! " # $ % & '
040 ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ;
060 < = > ? @ A B C D E F G H I J K L M N O
080 P Q R S T U V W X Y Z [ \ ] ^ _ ` a b c
100 d e f g h i j k l m n o p q r s t u v w
120 x y z { | } ~ , ƒ ˆ Š
140 Œ ˜ š œ ž Ÿ
160   ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ­ ® ¯ ° ± ² ³
180 ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿ À Á Â Ã Ä Å Æ Ç
200 È É Ê Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û
220 Ü Ý Þ ß à á â ã ä å æ ç è é ê ë ì í î ï
240 ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ        

Retorn a l'inici


ELS CARÀCTERS CODIFICATS SGML (NO VISTOS FINS ARA)

&amp; "&" -- abreviació de i
&nbsp; " " -- espai dur
&iexcl; "¡" -- signe d'exclamació inicial
&cent; "¢" -- signe de centau
&pound; "£" -- signe de la lliura esterlina
&curren; "¤" -- general currency sign
&yen; "¥" -- signe del ien
&brvbar; "¦" -- barra vertical trencada
&sect; "§" -- signe de secció
&uml; "¨" -- trema (dièresi)
&copy; "©" -- signe del copyright
&ordf; "ª" -- indicador ordinal, femení
&laquo; "«" -- parèntesi angular de cites, esquerre
&not; "¬" -- signe no
&shy; "­" -- guió blan
&reg; "®" -- marca de registre
&macr; "¯" -- màcron
&deg; "°" -- signe de grau
&plusmn; "±" -- signe més/menys
&sup2; "²" -- exponent dos
&sup3; "³" -- exponent tres
&acute; "´" -- accent agut
&micro; "µ" -- micro
&para; "¶" -- signe de paràgraf
&middot; "·" -- punt alt
&cedil; "¸" -- c trencada
&sup1; "¹" -- exponent u
&ordm; "º" -- indicador ordinal masculí
&raquo; "»" -- parèntesi angular de citació, dret
&frac14; "¼" -- fracció un quart
&frac12; "½" -- fracció meitat
&frac34; "¾" -- fracció tres quarts
&iquest; "¿" -- signe d'interrogació inicial
&times; "×" -- signe de multiplicació.
&dtimes; "÷" -- signe de divisió.

Retorn a l'inici


Símbols diacrítics de les llengües eslaves escrites amb l’alfabet llatí

El charset per a Windows 95 que conté els símbols de les llengües eslaves escrites amb l’alfabet llatí és el windows-1250 o charset=iso-8859-2. Si voleu més informació al respecte, aneu a les següents URLs:

Volba kodovani

Tento dokument obsahuje ceske znaky s diakritickymi znamenky. Prosim vyberte si kodovani, ktere podporuje Vas klient:
ASCII-1
ASCII-2
hacky a carky budou odstraneny, jako v tomto textu
Kodova stranka 1250
obvykla v prostredi MS-Windows
ISO 8859-2 (ISO Latin 2)
obvykla v operacnim systemu Unix
Macintosh
kod, pouzivany na pocitacich Apple Macintosh
Kod bratri Kamenickych
nejcastejsi v textovem rezimu MS-DOS
Kodova stranka 852
PC Latin 2
Kod KOI 8 CS
opravdu to nekdo pouziva?
Tento kod Vam prinasi SaCzech

Reply-To: "Allers,Heinrich"
Sender: "Foro para profesionales de bibliotecas y documentacion."
<IWETEL@LISTSERV.REDIRIS.ES>
From: "Allers,Heinrich" <allers@GOETHE.DE>
URL: Allers
Subject: [IWETEL] UNICODE et al.: Base de dades de 6.600 caràcters
To: IWETEL@LISTSERV.REDIRIS.ES

Benvolguts col·legues d'IWETEL: un col·lega de la Biblioteca Universitària de la Universitat
Tècnica de Brúnsvic (Alemanya), en Bernhard Eversberg, ha dut a
terme la feina de crear una base de dades que tracta de la representació
de devés 6.600 caràcters coberts per l'UNICODE i la conversió
entre 40 taules de codis.

Em sembla una feina d'interès per tothom que tingui a veure amb la representació
i el tractament correcte dels caràcters dels diferents idiomes.

Per aquesta raó em permeto de fer-vos coneixedors del text (en anglès)
amb el qual l'autor d'aqueixa base de dades descriu amb detall la base de dades en qüestió
i l'ofereix a qualsevol que hi pugui estar interessat.


####################################################################
UNIC : Unicode Reference Database of Character Encodings 971126
-------------------------------------------------------- UB Braunschweig

In the course of developing multiplatform and multipurpose database software
at Braunschweig University Library, we frequently encounter character conver-
sion tasks. Since there is an unmistakable trend towards UNICODE, we made an
effort to set up a universal reference database of encodings. This should
serve us, from now on, to produce new conversion tables as needed much
quicker and more reliably than before, since the database was derived from
the latest versions of official tables.
We are making the whole thing freely available to everybody who can see a
use for it.


The database serves two functions:
1. Browsing and searching in new ways within UNICODE and other code lists

2. Instantaneous production of conversion lists between any two of
40 different code lists, including SGML, USMARC, EBCDIC etc.

UNIC contains records for some 6.600 characters, that's all non-ideographic
characters currently covered by UNICODE. In a similar endeavor, a database
for the CJK scripts was set up at the Bodleian Library in Oxford by David
Helliwell. Since both databases operate under "allegro", our library data-
base system, we can make them both available on our FTP server (see below).
The CJK database, however, will take some more time since it needs updating.


There are 9 indexes:
1 : Names of characters (official UNICODE names, old and new versions)
example: LATIN SMALL LETTER U WITH CARON
2 : Letters, Ligatures, Digits (names of letters only, old and new versions)
example: U WITH CARON (old: U HACEK)
3 : Keyword index (all words occuring in the UNICODE names)
example: every single word of LATIN SMALL LETTER U WITH CARON
4 : Directionality, Decomposition types (technical details of UNICODE)
5 : Number values and digits (of those codes designating digits and numbers)
6 : Comments (just for convenience)
7 : General category (a classification of symbols)
example:
8 : Related (equivalent) characters (of upper/lower equivalents)
9 : Unicode 2-Byte codes (hexadecimal)
example: 01d4= LATIN SMALL LETTER U WITH CARON
Lists of other code tables (see below)

These indexes can be browsed up and down ...

...
...
...

List of character tables contained in UNIC database
---------------------------------------------------
The lists can be found in numerical order in index 9 under the
following prefixes:
(Go to index 9, enter "m 850" for example)

m MS-DOS PC code tables
437 us
850 latin1
852 latin2
863 canada
865 nordic
861 iceland
860 portug
855 cyrill
866 crillRuss
869 greek
857 turk
862 hebrew
864 arabic


w MS-Windows code tables
1252 Latin
1250 Latin2
1251 Cyrill
1257 Baltic
1253 Greek
1254 Turkish
1255 Hebrew
1256 Arabic
1258 Vietnam


i ISO9 8859 tables
-1 Latin1: IDENTICAL with UNICODE x00-xFF !
-2 Latin2
-3 Latin3
-4 Latin4
-5 Cyrillic
-6 Arabic
-7 Greek
-8 Hebrew
-9 Latin5
ddb MAB2 Codes of Deutsche Bibliothek Frankfurt (ISO 5426)


z EBCDIC tables
037 USCanada
500 International
875 Greek
1026 Latin5 (Turkish)
ddb MAB1 Deutsche Bibliothek's old code table


u USMARC codes
p Pica codes
o "allegro" so-called OSTWEST code list (extended PC 437)
s SGML (including HTML) so-called "entities"
y Macintosh Roman
...
...
...

>How to get it and install it
>---------------------------- > >It is a DOS application to run on any PC or in any DOS box.(With time permitting, we'll set up a Web page for it)
ftp 134.169.20.1
anonymous
<your e-mail address> bin
cd formate
get unic.exe [it contains unic.txt]
quit

Move UNIC.EXE to any subdirectory. Start it, and it will unwrap itself.
In any case, you have to have ANSI.SYS installed for proper displays.
Then start UNI.BAT.

B. Eversberg Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel. +49 531 391-5026 , -5011 , FAX -5836
e-mail B.Eversberg@tu-bs.de

            Per a qualssevol Suggeriments, Propostes i Crítiques (especialment, si detecteu "gassapos")
no dubteu a adreçar-vos a mrr@tinet.fut.es

                           (Aquesta pàgina de vincles ha estat feta a Tarragona (Catalunya). El seu ús és totalment lliure; la podeu reproduir totalment o parcialment, però us agrairíem que, si ho feu, ens esmenteu encara que sigui breument).