# Chaînes de caractères

## Création d'une chaine

On peut les créer avec des ``'`` ou ``"``. Ces caractères servent à délimiter les 
début et la fin du texte de la chaîne de caractère. Les guillemets 
simples ``'`` et doubles ``"`` sont équivalents. On pourra choisir l'un ou 
l'autre. Il sera cependant judicieux, si une chaîne de caractère doit contenir
un de ces guillemets, d'utiliser l'autre pour le début et la fin de la chaîne. 

In [1]:
s = "Bonjour"
s = 'Bonjour'
s = "Aujourd'hui"


Pour créer une chaîne de caractère sur plus d'une ligne on utilise ``'''`` ou ``"""``

In [2]:
s = """Bonjour, 
Comment allez-vous ?"""

Les **caractères spéciaux** sont les caractères qui ne sont pas affichables et en tant que tel. 
Par exemple, il existe un caractère pour le retour à la ligne. Il est possible
d'utiliser ce caractère dans une chaîne en utilisant ``\n``. L'antislash sert
ici de caractère d'échappement pour indiquer que l'on va entrer un caractère
spécial. La lettre ``n`` indique ici qu'il s'agit d'un retour à la ligne. 

Dans les exemples suivants, le retour à la ligne est un caractère. On peut le créer en utilisant ```\n```.

In [3]:
s = """a
b"""
print(len(s))
s2 = "a\nb"
assert s==s2

3


L'antislash sert aussi à insérer un guillemet dans une chaîne :

In [4]:
s = 'Aujourd\'hui'

## Manipulation des chaînes de caractères

Comme tout conteneur indexable, il est possible d'accéder à chaque caractère d'une chaîne ou à une partie d'une 
chaîne. La longueur de la chaîne s'obtient avec la fonction ``len``. On peut aussi faire une boucle ``for`` sur chacun des éléments de la chaîne.

In [5]:
s = "Pierre"
print(s[0])
print(s[2:4])


P
er


Cependant, il n'est pas possible de modifier une chaîne de caractères (l'opération ``s[0]='p'`` échoue).

L'opérateur ```+``` permet de concaténer des chaînes de caractères. L'opérateur ```*``` permet de répeter ```n``` fois la même chaîne de caractère

In [6]:
s1 = "Bonjour"
s2 = 'tout le monde'
print(s1 + ' ' + s2)

Bonjour tout le monde


In [7]:
print('ha!'*10)

ha!ha!ha!ha!ha!ha!ha!ha!ha!ha!


## Formatage des chaînes de caractère

Le formatage d'une chaîne de caractère consiste à mettre dans une chaine un élément variable. Cette opération est souvent utilisée lorsque l'on veut afficher proprement 
un résultat

In [8]:
heure = 15
minute = 30
"Il est {0}h{1}".format(heure, minute)

'Il est 15h30'

Pour insérer un élément ou plusieurs éléments variables 
dans une chaîne de caractère, on crée d'abord cette chaîne en mettant à la 
place des ces éléments une accolade avec un numéro d'ordre ``{i}``. En appliquant la 
méthode ``format`` sur cette chaîne, les accolades seront remplacées par 
le ième argument. 

Il est possible de passer l'argument par nom dans ce cas la clé est le nom de l'argument. 

In [9]:
"Il est {heure}h{minute}".format(heure=heure, minute=minute)

'Il est 15h30'

Depuis la version 3.6 de Python, il est possible de demander à Python d'utiliser automatiquement les variables locales à l'aide du préfix ``f``.

In [10]:
f"Il est {heure}h{minute}"

'Il est 15h30'

Il est aussi possible de demander d'utiliser un attribut d'un objet : 


In [11]:
z = 1 + 2J
print(f'Re(z) = {z.real}')

Re(z) = 1.0


En utilisant le formatage de chaîne de caractère, il est possible de spécifier en détail comment ce nombre doit s'afficher. Par exemple, si il s'agit d'un nombre à virgule flottante, combien de décimales faut-il afficher, faut il utiliser la notation scientifique, etc. Pour cela, on rajoute à l'intérieur des accolades un code particulier. Ce code est précédé du signe ':'. 

In [12]:
from math import pi
'{0:.5f}'.format(pi)
c = 299792458. # Vitesse de la lumière en m/s
'c = {0:.3e} m/s'.format(c)


'c = 2.998e+08 m/s'

Le 'f' indique que l'on veut une notation a virgule fixe, le 'e' une notation scientifique. Le chiffre que l'on indique après le '.' donne le nombre de chiffre après la virgule que l'on souhaite.


[L'aide en ligne](https://docs.python.org/fr/3.5/library/string.html#formatstrings) de Python fournit d'autres exemples et des détails. 

## Quelques méthodes utiles

* ``strip`` (enlève les espaces blancs au début et fin de la chaîne)
* ``split`` (coupe la chaine et renvoie une liste de chaîne)
* ``join`` (inverse de slit : rassemble une liste de chaîne avec un chaîne)
* ``startswith``, ``endswith``
* ``lower``, ``upper`` (convertit en minuscule ou majuscule)
* ``replace``

In [1]:
s=" bonjour "
print(s)
print(s.strip())

s='un deux trois'
print(s.split())

l = ['pomme', 'pêche', 'poire', 'abricot']
s = ', '.join(l)
print(s)

 bonjour 
bonjour
['un', 'deux', 'trois']
pomme, pêche, poire, abricot


## Unicode

Unicode est un standard informatique qui permet des échanges de textes dans différentes langues, à un niveau mondial. Il vise au codage de texte écrit en donnant à tout caractère de n'importe quel système d'écriture un nom et un identifiant numérique, et ce de manière unifiée, quelle que soit la plateforme informatique ou le logiciel utilisé. 

On peut créer des chaînes directement en unicode. On peut aussi utiliser le code en hexadecimal.

In [14]:
s1 = "Rayon γ"
s2 = "Rayon \u03B3"
print(s2)
assert s1==s2

Rayon γ


Il est possible de convertir un caractère en nombre et vice-versa

In [15]:
print(ord('€'))
print(hex(ord('€')))

8364
0x20ac


In [16]:
' '.join([chr(97 + i) for i in range(26)])

'a b c d e f g h i j k l m n o p q r s t u v w x y z'

On trouve même des émoticones

In [17]:
s = "\U0001f600"
print(s)

😀


On peut aussi utilier le nom unicode

In [18]:
print("\N{slightly smiling face}")

🙂
