Mission 7 : Dictionnaires

Introduction

Le but de cette mission est de développer un outil qui permet un utilisateur de chercher répétitivement dans un fichier de texte: pour des mots donnés, l'outil va imprimer les phrases dans lesquelles tous les mots donnés sont présents. Pour assurer que l'outil ne prend pas trop de temps pour déterminer ces phrases, on va construire un index des mots présents dans les phrases des documents. On utilisera les dictionnaires pour stocker l'index.

Objectifs

Objectifs individuels

A l’issue de ce problème, chacun d’entre vous sera en mesure d’exploiter les notions suivantes :

dictionnaires
fichiers

Préparation, étude et apprentissage

La matière relative à cette mission est décrite dans les sections suivantes du syllabus en ligne :

Dictionaries

Questionnaire de démarrage

Questions à choix multiple

Les questions à choix multiples de cette mission sont également accessibles en ligne depuis https://inginious.info.ucl.ac.be/course/LSINF1101-PYTHON/Session7_QCM

Question 1

Considérez le code suivant:

codes = {"Bruxelles" : [1000,1020,1030], "Louvain-la-Neuve" : [1348], "Wavre": [1300,1301]}

Les morceaux de code ci-dessous sont executés chacun après ce code. Décrivez ce qui se passe pour chacun des cas.

On exécute :

print(codes["Bruxelles"])

On exécute :

print(codes["Mons"])

On exécute :

print(codes[1000])

On exécute :

print(codes.get("Mons",[]))

On exécute:

codes["Liege"] = [4000]
print(codes)

On exécute:

codes["Bruxelles"].append(1040)
print(codes)

On exécute:

codes.get("Bruxelles",[]).append(1050)
print(codes)

On exécute:

codes.get("Arlon",[]).append(8362)
print(codes)

On exécute:

if "Bruxelles" in codes:
  print("Found!")
else:
  print("Not found!")

On exécute:

if 1000 in codes:
  print("Found!")
else:
  print("Not found!")

On exécute:

for x in codes:
  print(x)

On exécute:

for x in codes:
  print(codes[x])

On exécute:

for x in codes.items():
  print(x)

On exécute:

for x, y in codes.items():
  y = y + [2000]
print(codes)

On exécute:

for x, y in codes.items():
  y.append(2000)
print(codes)

On exécute:

for x, y in codes.items():
  x = x + "*"
print(codes)

Question 2

Considérez le code suivant:

def mot_ligne(ligne):
    d = {}
    for mot in ligne:
        d[mot] = 1
    return d

Quelle est la taille du dictionnaire résultant des appels suivants ? Pourquoi ?

mot_ligne(["the","world","goes","round"])
mot_ligne(["the","world","and","the","galaxy"])
mot_ligne(["run","run","run"])

Question 3

Écrivez une fonction avec la spécification suivante:

def create_index ( list_of_words ):
    """ crée un index pour une liste de chaînes de caractères.
        L'index se compose d'un dictionnaire dans lequel pour chaque
        chaîne de caractères dans list_of_strings on retrouve une
        liste des positions où l'on retrouve cette chaîne de
        caractères.

        Par exemple, pour la liste

          ["the","galaxy","and","the","universe","are","the","same"]

        Le résultat est

          {"the":[0,3,6],"galaxy":[1],"and":[2],"universe":[4], \
           "are":[5],"same":[7]}

    Args:
        list_of_words: une liste de chaînes de caractères
    Retourne:
        un dictionnaire avec pour chaque mot dans la liste,
        une liste des positions de cette chaîne de caractères
        dans la liste
    """

Question 4

Étant donnée:

une matrice representée en utilisant des listes imbriquées
une matrice representée en utilisant un dictionnaire, où les zéros ne sont pas stockées.

Par exemple,

l = [ [ 0, 2, 4 ], [ 4, 1, 0 ] ]
d = { (0,1): 2, (0,2): 4, (1,0): 4, (1,1): 1 }

Écrivez une fonction equal(l,d) qui détermine si d contient les même valeurs pour chaque élément de l. (Nous permettons que d soit plus large que l.)

Question 5

Étant donné une structure de données comme la suivante:

System Message: ERROR/3 (<string>, line 420)

Content block expected for the "code-block" directive; none found.

.. code-block:: python

l = [{"City": "Bruxelles", "Country": "Belgium"},: {"City": "Berlin", "Country": "Germany"}, {"City": "Paris", "Country": "France"}]

Écrivez une fonction get_country(l,name) qui, pour le nom d'une ville name et une structure de données l du format illustré dans l'exemple, retourne le nom du pays dans lequel la ville est localisée. La fonction retourne None si la ville n'est pas dans l.