我正在使用普克气流图像,并通过编辑dockerfile升级气流版本,其中包括谷歌和安装的apache-气流提供商-谷歌2.2.0作为python依赖项和谷歌或gcs作为气流依赖,当我使用构建容器时使用
`docker build --rm --build-arg AIRFLOW_DEPS="google" --build-arg AIRFLOW_DEPS="google" --build-arg PYTHON_DEPS="httplib2==0.18.1" --build-arg PYTHON_DEPS="apache-airflow-providers-google==2.2.0" -t puckel/docker-airflow .`
我还将python包添加到我的要求.txt文件,该文件在下面列出,但是当我在本地主机上进入气流时,它仍然显示“损坏的DAG:[/usr/本地/气流/dags/其他文件夹/dag.py]没有名为'google'的模块。我该如何解决这个问题?
以下是我修改版本的dockerfile文件
# VERSION 1.10.9
# AUTHOR: Matthieu "Puckel_" Roisil
# DESCRIPTION: Basic Airflow container
# BUILD: docker build --rm -t puckel/docker-airflow .
# SOURCE: https://github.com/puckel/docker-airflow
FROM python:3.7-slim-buster
LABEL maintainer="Puckel_"
# Never prompt the user for choices on installation/configuration of packages
ENV DEBIAN_FRONTEND noninteractive
ENV TERM linux
# Airflow
ARG AIRFLOW_VERSION=1.10.14
ARG AIRFLOW_USER_HOME=/usr/local/airflow
ARG AIRFLOW_DEPS=""
ARG PYTHON_DEPS=""
ENV AIRFLOW_HOME=${AIRFLOW_USER_HOME}
# Define en_US.
ENV LANGUAGE en_US.UTF-8
ENV LANG en_US.UTF-8
ENV LC_ALL en_US.UTF-8
ENV LC_CTYPE en_US.UTF-8
ENV LC_MESSAGES en_US.UTF-8
# Disable noisy "Handling signal" log messages:
# ENV GUNICORN_CMD_ARGS --log-level WARNING
RUN set -ex \
&& buildDeps=' \
freetds-dev \
libkrb5-dev \
libsasl2-dev \
libssl-dev \
libffi-dev \
libpq-dev \
git \
' \
&& apt-get update -yqq \
&& apt-get upgrade -yqq \
&& apt-get install -yqq --no-install-recommends \
$buildDeps \
freetds-bin \
build-essential \
default-libmysqlclient-dev \
apt-utils \
curl \
rsync \
netcat \
locales \
&& sed -i 's/^# en_US.UTF-8 UTF-8$/en_US.UTF-8 UTF-8/g' /etc/locale.gen \
&& locale-gen \
&& update-locale LANG=en_US.UTF-8 LC_ALL=en_US.UTF-8 \
&& useradd -ms /bin/bash -d ${AIRFLOW_USER_HOME} airflow \
&& pip install -U pip setuptools wheel \
&& pip install pytz \
&& pip install pyOpenSSL \
&& pip install ndg-httpsclient \
&& pip install pyasn1 \
&& pip install apache-airflow[crypto,celery,postgres,hive,jdbc,mysql,ssh${AIRFLOW_DEPS:+,}${AIRFLOW_DEPS}]==${AIRFLOW_VERSION} \
&& pip install 'redis==3.2' \
&& if [ -n "${PYTHON_DEPS}" ]; then pip install ${PYTHON_DEPS}; fi \
&& apt-get purge --auto-remove -yqq $buildDeps \
&& apt-get autoremove -yqq --purge \
&& apt-get clean \
&& rm -rf \
/var/lib/apt/lists/* \
/tmp/* \
/var/tmp/* \
/usr/share/man \
/usr/share/doc \
/usr/share/doc-base
COPY script/entrypoint.sh /entrypoint.sh
COPY config/airflow.cfg ${AIRFLOW_USER_HOME}/airflow.cfg
COPY requirements.txt /requirements.txt
RUN chown -R airflow: ${AIRFLOW_USER_HOME}
EXPOSE 8080 5555 8793
USER airflow
WORKDIR ${AIRFLOW_USER_HOME}
ENTRYPOINT ["/entrypoint.sh"]
CMD ["webserver"]
以下是我的docker撰写文件:
version: '3.7'
services:
postgres:
image: postgres:9.6
environment:
- POSTGRES_USER=airflow
- POSTGRES_PASSWORD=airflow
- POSTGRES_DB=airflow
logging:
options:
max-size: 10m
max-file: "3"
webserver:
image: puckel/docker-airflow:1.10.9
restart: always
depends_on:
- postgres
environment:
- LOAD_EX=n
- EXECUTOR=Local
logging:
options:
max-size: 10m
max-file: "3"
volumes:
- ./dags:/usr/local/airflow/dags
- ./requirements.txt:/requirements.txt
# - ./plugins:/usr/local/airflow/plugins
ports:
- "8080:8080"
command: webserver
healthcheck:
test: ["CMD-SHELL", "[ -f /usr/local/airflow/airflow-webserver.pid ]"]
interval: 30s
timeout: 30s
retries: 3
python:
image: python:rc-buster
以下是我的requirements.txt文件
httplib2==0.18.1
google==3.0.0
pandas==1.2.4
apache-airflow-providers-google==2.2.0
以下是来自dag的相关代码:
import datetime
import logging
import dateutil
import pandas as pd
import numpy as np
from airflow import models, utils
from airflow.operators.python_operator import PythonOperator
from airflow.contrib.operators.bigquery_to_gcs import BigQueryToCloudStorageOperator
from airflow.operators.python_operator import BranchPythonOperator
from airflow.contrib.hooks.bigquery_hook import BigQueryHook
from airflow.contrib.operators.gcs_to_bq import GoogleCloudStorageToBigQueryOperator
from airflow.operators.dummy_operator import DummyOperator
from airflow.hooks.http_hook import HttpHook
from pandas.io.json import json_normalize
from pandas.errors import EmptyDataError
from pathlib import Path
from lz_warnings import *
from utils import task_fail_slack_alert
import warnings
问题内容: 我已安装在主目录中。 我正在尝试运行一个需要python 2.7.x版本的脚本,而我却丢失了bz2错误 我尝试安装bz2模块,但出现很多错误 问题答案: 可能是从源代码构建python时,没有bz2标头。 在Ubuntu / Debian上安装它们: 软呢帽: 并再次构建python。您可能会注意到python在配置/构建时会检查很多库,如果您错过其中的一些库,那么您的案例可能就不会支
问题内容: 我有另一个线程在“缺少zlib”上寻求帮助。有了很好的帮助,问题已解决(几乎)。 现在,我对自己构建Python(在Ubuntu 10.10上)感兴趣。 一些重要的问题引起了我的注意: 构建Python(例如2.7.1)之后,如果缺少模块,是否需要重新构建Python? 有没有一种方法可以在构建Python之前找出缺少的模块?说sqlite3。我已为系统默认值(Python 2.6.6
我正在将一个EJB项目部署为Jboss WildFly18中的EAR。我的耳朵目前的布局是这样的: 我尝试过通过jboss-deployment-structure.xml和manifest.mf定义依赖关系,但没有成功。我还尝试用包名(即com.tura.common)命名依赖项,因为我已经看到这两种格式都使用过。还是没运气。我不太确定我在这里错过了什么;看来我是在按照预期的布局。有谁能帮忙吗?
我不明白如何用anaconda3设置我的PYTHONPATH。 我是否缺少安装步骤?
已安装,可用和缺少的模块 在前面的章节中,我们已经了解了有助于授权,身份验证和记帐(AAA)的各种模块。 作为本章的复习和介绍,下表列出了其中一些: Module Functon files 使用位于FreeRADIUS配置目录中的用户文件来查找用户的详细信息。 sql 一个模块,配置为使用特定于数据库的子模块来查找用户的详细信息。 还用于在SQL数据库中存储记帐记录并检查同时连接。 logint
问题内容: 我已经配置了jenkins来构建我的ios- swift应用程序。我使用过xcode版本8.1和swift版本3。我是Jenkins的新手,并继续集成过程。根据我的控制台输出,我认为构建成功。因为这样的控制台输出打印 但是在此控制台输出打印失败消息之后。 我这样的gofinal控制台输出。 与此相关的问题是什么? 问题答案: 经过广泛的研究,我终于找到了解决该问题的方法。我所做的第二个