airflow.providers.google.cloud.operators.natural_language

此模組包含 Google Cloud Natural Language operator。

屬性

MetaData

CloudNaturalLanguageAnalyzeEntitiesOperator

在文字中查詢命名實體以及各種屬性。

CloudNaturalLanguageAnalyzeEntitySentimentOperator

與 AnalyzeEntities 類似,也會分析與每個實體及其提及相關的感情。

CloudNaturalLanguageAnalyzeSentimentOperator

分析提供文字的感情。

CloudNaturalLanguageClassifyTextOperator

將文件分類到不同的類別。

模組內容

airflow.providers.google.cloud.operators.natural_language.MetaData[source]
class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeEntitiesOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

在文字中查詢命名實體以及各種屬性。

示例屬性:實體型別、顯著性、每個實體的提及等。

另請參閱

有關如何使用此 operator 的更多資訊,請參閱指南:分析實體

引數:
  • document (dict | google.cloud.language_v1.types.Document) – 輸入文件。如果提供的是字典,則其形式必須與 protobuf 訊息 Document 相同

  • encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用於計算偏移量的編碼型別。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。

  • timeout (float | None) – 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時時間適用於每個單獨的嘗試。

  • metadata (MetaData) – 提供給方法的附加元資料。

  • gcp_conn_id (str) – 連線到 Google Cloud 時使用的連線 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選的服務帳號,用於使用短期憑據進行模擬,或按順序排列的帳號列表,用於獲取列表中最後一個帳號的 access_token,該 token 將用於請求模擬。如果設定為字串,則該帳號必須授予源帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中各身份必須授予緊鄰的前一個身份 Service Account Token Creator IAM 角色,列表中的第一個帳號將此角色授予源帳號(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]
document[source]
encoding_type = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

建立 operator 時派生。

context 與渲染 jinja 模板時使用的字典相同。

有關更多 context,請參閱 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeEntitySentimentOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

與 AnalyzeEntities 類似,也會分析與每個實體及其提及相關的感情。

另請參閱

有關如何使用此 operator 的更多資訊,請參閱指南:分析實體情感

引數:
  • document (dict | google.cloud.language_v1.types.Document) – 輸入文件。如果提供的是字典,則其形式必須與 protobuf 訊息 Document 相同

  • encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用於計算偏移量的編碼型別。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。

  • timeout (float | None) – 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時時間適用於每個單獨的嘗試。

  • metadata (MetaData) – 提供給方法的附加元資料。

  • gcp_conn_id (str) – 連線到 Google Cloud 時使用的連線 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選的服務帳號,用於使用短期憑據進行模擬,或按順序排列的帳號列表,用於獲取列表中最後一個帳號的 access_token,該 token 將用於請求模擬。如果設定為字串,則該帳號必須授予源帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中各身份必須授予緊鄰的前一個身份 Service Account Token Creator IAM 角色,列表中的第一個帳號將此角色授予源帳號(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]
document[source]
encoding_type = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

建立 operator 時派生。

context 與渲染 jinja 模板時使用的字典相同。

有關更多 context,請參閱 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageAnalyzeSentimentOperator(*, document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

分析提供文字的感情。

另請參閱

有關如何使用此 operator 的更多資訊,請參閱指南:分析情感

引數:
  • document (dict | google.cloud.language_v1.types.Document) – 輸入文件。如果提供的是字典,則其形式必須與 protobuf 訊息 Document 相同

  • encoding_type (google.cloud.language_v1.types.EncodingType | None) – API 用於計算偏移量的編碼型別。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。

  • timeout (float | None) – 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時時間適用於每個單獨的嘗試。

  • metadata (MetaData) – 提供給方法的附加元資料。

  • gcp_conn_id (str) – 連線到 Google Cloud 時使用的連線 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選的服務帳號,用於使用短期憑據進行模擬,或按順序排列的帳號列表,用於獲取列表中最後一個帳號的 access_token,該 token 將用於請求模擬。如果設定為字串,則該帳號必須授予源帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中各身份必須授予緊鄰的前一個身份 Service Account Token Creator IAM 角色,列表中的第一個帳號將此角色授予源帳號(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]
document[source]
encoding_type = None[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

建立 operator 時派生。

context 與渲染 jinja 模板時使用的字典相同。

有關更多 context,請參閱 get_template_context。

class airflow.providers.google.cloud.operators.natural_language.CloudNaturalLanguageClassifyTextOperator(*, document, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]

Bases: airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator

將文件分類到不同的類別。

另請參閱

有關如何使用此 operator 的更多資訊,請參閱指南:分類內容

引數:
  • document (dict | google.cloud.language_v1.types.Document) – 輸入文件。如果提供的是字典,則其形式必須與 protobuf 訊息 Document 相同

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。

  • timeout (float | None) – 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時時間適用於每個單獨的嘗試。

  • metadata (MetaData) – 提供給方法的附加元資料。

  • gcp_conn_id (str) – 連線到 Google Cloud 時使用的連線 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選的服務帳號,用於使用短期憑據進行模擬,或按順序排列的帳號列表,用於獲取列表中最後一個帳號的 access_token,該 token 將用於請求模擬。如果設定為字串,則該帳號必須授予源帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中各身份必須授予緊鄰的前一個身份 Service Account Token Creator IAM 角色,列表中的第一個帳號將此角色授予源帳號(模板化)。

template_fields: collections.abc.Sequence[str] = ('document', 'gcp_conn_id', 'impersonation_chain')[source]
document[source]
retry[source]
timeout = None[source]
metadata = ()[source]
gcp_conn_id = 'google_cloud_default'[source]
impersonation_chain = None[source]
execute(context)[source]

建立 operator 時派生。

context 與渲染 jinja 模板時使用的字典相同。

有關更多 context,請參閱 get_template_context。

本條目有幫助嗎?