pyspark.streaming.kinesis.KinesisUtils.createStream

靜態 KinesisUtils。 createStream ( ssc: pyspark.streaming.context。StreamingContext, kinesisAppName: str, streamName: str, endpointUrl: str, regionName: str, initialPositionInStream: str, checkpointInterval: int, metricsLevel: int = 0, storageLevel: pyspark.storagelevel.StorageLevel = StorageLevel(True, True, False, False, 2), awsAccessKeyId: Optional[str] = None, awsSecretKey: Optional[str] = None, decoder: Union[Callable[[Optional[bytes]], T], Callable[[Optional[bytes]], Optional[str]]] = , stsAssumeRoleArn: Optional[str] = None, stsSessionName: Optional[str] = None, stsExternalId: Optional[str] = None )(pyspark.streaming.dstream→聯盟。DStream[聯盟[T, str,沒有]],pyspark.streaming.dstream.DStream [T]]

創建一個輸入流,從運動將消息流。這個使用運動的客戶端庫(氯化鉀)將消息從運動。

參數
ssc StreamingContext

StreamingContext對象

kinesisAppName str

運動運動所使用的應用程序名稱客戶端庫(氯化鉀)更新DynamoDB

streamName str

動作流的名字

endpointUrl str

運動服務的Url(例如,https://kinesis.us -東- 1. - amazonaws.com)

regionName str

地區名稱運動所使用的客戶端庫(氯化鉀)更新DynamoDB(租賃協調和檢查點)和監測(指標)

initialPositionInStream int

在缺乏運動檢查點信息,這是工人的初始流的起始位置。值是每個動作的開始流的限製24小時(InitialPositionInStream.TRIM_HORIZON)或流的尖端(InitialPositionInStream.LATEST)。

checkpointInterval int

運動檢查點的檢查點間隔(以秒為單位)。看到運動引發流文檔不同類型的檢查點的更多細節。

metricsLevel int

CloudWatch PutMetrics水平。可以被設置為詳細、總結或沒有。(缺省為詳細)

storageLevel pyspark.StorageLevel、可選

用於存儲接收到的對象存儲水平(缺省為StorageLevel.MEMORY_AND_DISK_2)

awsAccessKeyId str,可選

AWS AccessKeyId(默認是沒有的。如果沒有,將使用DefaultAWSCredentialsProviderChain)

awsSecretKey str,可選

AWS SecretKey(默認是沒有的。如果沒有,將使用DefaultAWSCredentialsProviderChain)

譯碼器 功能,可選

函數用於解碼值(缺省為utf8_decoder)

stsAssumeRoleArn str,可選

在攻擊我的角色承擔當使用STS課程閱讀從運動流(默認是沒有)。

stsSessionName str,可選

名字來唯一地標識STS課程用於讀取動作流,如果使用STS(默認是沒有)。

stsExternalId str,可選

外部ID,可以用來驗證假設我角色的信任政策,如果使用STS(默認是沒有)。

返回
DStream對象

筆記

給定的AWS憑證將保存在DStream檢查點如果啟用了檢查點。確保你的檢查點目錄是安全的。