Verbinden mit Amazon S3

Sie können diese Verbindung in den Hadoop MapReduce- und Spark-Datenqualitätsaufträgen für Big Data verwenden.

  1. Greifen Sie über eines der folgenden Module auf die Seite Datenquellen zu:
    Management Console:
    Öffnen Sie die Management Console über die URL: http://server:port/managementconsole, wobei server der Servername oder die IP-Adresse Ihres Spectrum™ Technology Platform-Servers und port der von Spectrum™ Technology Platform verwendete HTTP-Port ist.
    Anmerkung: Der HTTP-Port ist standardmäßig auf 8080 eingestellt.
    Öffnen Sie Ressourcen > Datenquellen.
    Metadata Insights:
    Öffnen Sie die Management Console über die URL: http://server:port/metadata-insights, wobei server der Servername oder die IP-Adresse Ihres Spectrum™ Technology Platform-Servers und port der von Spectrum™ Technology Platform verwendete HTTP-Port ist.
    Anmerkung: Der HTTP-Port ist standardmäßig auf 8080 eingestellt.
    Öffnen Sie Datenquellen.
  2. Klicken Sie auf die Schaltfläche Hinzufügen .
  3. Geben Sie im Feld Name einen Namen für die Verbindung ein. Sie können den Namen frei wählen.
    Anmerkung: Sobald Sie eine Verbindung gespeichert haben, können Sie den Namen nicht mehr ändern.
  4. Wählen Sie im Feld Typ Cloud aus.
  5. Wählen Sie im Feld Cloud-Dienste die Option Amazon S3 aus.
  6. Geben Sie im Feld Bucket-Name den Bucket-Namen ein, wie er in Ihrem Amazon S3-Cloud-Dienst definiert ist. Dies ist der Bucket, in dem Spectrum™ Technology Platform Dateien liest und schreibt.
  7. Geben Sie Ihren Zugriffsschlüssel und Ihren geheimen Schlüssel ein, die Ihnen von Amazon zugewiesen wurden.
  8. Wählen Sie im Feld Speichertyp die Redundanzstufe aus, die Sie für die Speicherung von Daten zulassen möchten.
    Standard
    Dies ist die Standardstufe von Amazon S3 für die Redundanz.
    Reduzierte Redundanz
    Nicht kritische und einfach reproduzierbare Daten werden mit niedrigerer Redundanz gespeichert. Sie erhalten so angemessen zuverlässigen Speicher zu geringeren Kosten.
  9. Wählen Sie im Abschnitt Verschlüsselung die Verschlüsselungsmethode für die Daten aus. Sie können serverseitige Verschlüsselung, clientseitige Verschlüsselung oder beides auswählen.
    Serverseitiger Schlüssel
    Die Daten werden auf Serverseite ver- und entschlüsselt. Ihre Daten werden als Klartext an den Amazon-Cloud-Dienst übertragen, wo sie dann verschlüsselt und gespeichert werden. Beim Abruf werden die Daten vom Amazon-Cloud-Dienst entschlüsselt und dann als Klartext an Ihr System übertragen.
    Sie haben zwei Möglichkeiten, den Schlüssel anzugeben:
    • Von AWS verwaltet: Der Schlüssel wird automatisch vom Amazon S3-Cloud-Dienst generiert.
    • Vom Kunden bereitgestellt: Geben Sie den Schlüssel ein, der vom Amazon S3-Cloud-Dienst verwendet werden soll, um die Daten serverseitig zu ver- und zu entschlüsseln.
    Clientseitiger Schlüssel
    Die Daten werden auf Client-Seite ver- und entschlüsselt. Die Daten werden lokal auf Ihrem Client-System verschlüsselt und dann zum Amazon S3-Cloud-Speicher übertragen. Beim Abruf werden die Daten in verschlüsseltem Format zurück zu Ihrem System übertragen und dann auf dem Client-System entschlüsselt.

    Clientseitiger Schlüssel: Geben Sie den Schlüssel ein, der von Ihrem Client-System zum Ver- und Entschlüsseln von Daten verwendet werden soll.

    Wenn Sie sowohl Serverseitiger Schlüssel als auch Clientseitiger Schlüssel auswählen, werden Verschlüsselung und Entschlüsselung auf Server- und auf Client-Seite durchgeführt. Die Daten werden zuerst mit Ihrem clientseitigen Schlüssel verschlüsselt und dann in verschlüsseltem Format zu Amazon übertragen, wo sie noch einmal mit dem serverseitigen Schlüssel verschlüsselt und dann gespeichert werden. Beim Abruf entschlüsselt Amazon zuerst die Daten mit dem serverseitigen Schlüssel, überträgt die Daten in verschlüsseltem Format zu Ihrem System, wo sie dann mit dem clientseitigen Schlüssel endgültig entschlüsselt werden.

    Anmerkung: Um das Verschlüsselungsfeature der Amazon S3-Cloud zu verwenden, müssen Sie die Amazon S3-Sicherheits-JAR-Dateien installieren. Weitere Informationen finden Sie unter Verwenden von Amazon S3-Cloud-Verschlüsselung.

    Weitere Informationen über die Verschlüsselungsfeatures von Amazon S3 finden Sie unter:

    docs.aws.amazon.com/AmazonS3/latest/dev/UsingEncryption.html

  10. Wenn Sie Zugriffsberechtigungen festlegen möchten, klicken Sie im Abschnitt Berechtigungen auf .

    Es gibt drei Empfängertypen:

    Jeden
    Jeder, der nicht authentifizierter Benutzer ist oder der Gruppe „Protokollbereitstellung“ angehört.
    AuthentifizierteBenutzer
    Benutzer, die bei Amazon angemeldet sind.
    Protokollbereitstellung
    Benutzer, die in einem vom Benutzer angegebenen Bucket Aktivitätsprotokolle schreiben, wenn die Bucket-Protokollierung aktiviert ist.

    Wählen Sie für jeden Empfänger die gewünschten Berechtigungen aus:

    Öffnen/herunterladen
    Gestatten Sie dem Benutzer, die Datei herunterzuladen.
    Anzeige
    Gestatten Sie dem Benutzer, die aktuellen Berechtigungen der Datei anzuzeigen.
    Bearbeiten
    Gestatten Sie dem Benutzer, die Berechtigungen für die Datei zu ändern und festzulegen.
  11. Um die Verbindung zu testen, klicken Sie auf Testen.
  12. Klicken Sie auf Speichern.